A súrolódás megértése lineáris regressziós modellekben
A súrolódás annak mértéke, hogy egy modell mennyire képes eltávolítani a zajt az adatokból. Ez a reziduumok szórásának (az előrejelzett értékek és a tényleges értékek különbségének) és az eredeti adatok szórásának aránya. A magasabb súrolódási érték azt jelzi, hogy a modell jobban eltávolítja a zajt, míg az alacsonyabb súrolási érték azt jelzi, hogy a modell zajosabb.
Az Ön esetében lineáris regressziós modellt használ a ház árának előrejelzésére a jellemzői alapján. A modell súrolódása a következőképpen számolható:
Súrolás = (Maradékok varianciája) / (Eredeti adatok varianciája)
ahol a reziduumok szórása az előrejelzett árak és a tényleges árak közötti különbségek négyzetes átlaga, valamint a szórás az eredeti adatokból az egyes jellemzők és azok átlagértéke közötti különbségek négyzetes átlaga.
Például, ha a reziduumok szórása 100, az eredeti adatok varianciája pedig 1000, akkor a modell súrolódása a következő lenne:
Scrubbiness = (100) / (1000) = 0,1
Ez azt jelenti, hogy a modell csak a zaj 10%-át tudja eltávolítani az adatokból, és még mindig sok zaj van jelen az előrejelzésekben.
Fontos megjegyezni, hogy a súrolódás nem a modell pontosságának mértéke, hanem inkább annak mértéke, hogy a modell mennyire képes eltávolítani a zajt az adatokból. A nagy pontosságú modellek még mindig alacsony súrolással rendelkezhetnek, ha nagyon érzékenyek az adatok zajára.



