


Zrozumienie szorstkości w modelach regresji liniowej
szorstkość jest miarą tego, jak dobrze model jest w stanie usunąć szum z danych. Definiuje się ją jako stosunek wariancji reszt (różnicy między wartościami przewidywanymi a wartościami rzeczywistymi) do wariancji danych pierwotnych. Wyższa wartość szorowatości wskazuje, że model lepiej usuwa szum, podczas gdy niższa wartość szorowatości wskazuje, że model jest bardziej zaszumiony.…
W twoim przypadku używasz modelu regresji liniowej do przewidywania ceny domu na podstawie jego cech. Szorowalność modelu można obliczyć w następujący sposób:
Szorowalność = (Wariancja reszt) / (Wariancja danych pierwotnych)
gdzie wariancja reszt jest średnią kwadratów różnic między przewidywanymi cenami a cenami rzeczywistymi oraz wariancją pierwotnych danych to średnia kwadratów różnic między każdą cechą i jej średnią wartością.
Na przykład, jeśli wariancja reszt wynosi 100, a wariancja danych pierwotnych wynosi 1000, wówczas szorowalność modelu będzie wynosić:
Szorowalność = (100) / (1000) = 0,1
Oznacza to, że model jest w stanie usunąć tylko 10% szumu z danych, a w prognozach nadal występuje dużo szumu.
Warto zauważyć, że szorstkość nie jest miara dokładności modelu, ale raczej miara tego, jak dobrze model jest w stanie usunąć szum z danych. Model o dużej dokładności może nadal charakteryzować się niską szorowalnością, jeśli jest bardzo wrażliwy na szum w danych.



