Pochopení křupavosti v modelech lineární regrese
Scrubbiness je měřítkem toho, jak dobře je model schopen odstranit šum z dat. Je definován jako poměr rozptylu reziduí (rozdíl mezi předpokládanými hodnotami a skutečnými hodnotami) k rozptylu původních dat. Vyšší hodnota drhnutí znamená, že model lépe odstraňuje hluk, zatímco nižší hodnota drhnutí znamená, že je model hlučnější.……Ve vašem případě používáte model lineární regrese k předpovědi ceny domu na základě jeho vlastností. Vydrhnutí modelu lze vypočítat následovně:
Scrubbiness = (rozptyl zbytků) / (rozptyl původních dat)
kde rozptyl zbytků je průměr druhých mocnin rozdílů mezi předpokládanými cenami a skutečnými cenami a rozptyl původních dat je průměr kvadrátů rozdílů mezi každým prvkem a jeho střední hodnotou.
Pokud je například rozptyl reziduí 100 a rozptyl původních dat 1000, pak by drsnost modelu byla:
Scrubbiness = (100) / (1000) = 0,1
To znamená, že model je schopen odstranit pouze 10 % šumu z dat a v předpovědích je stále mnoho šumu.
Je důležité si uvědomit, že drhnutí není mírou přesnosti modelu, ale spíše mírou toho, jak dobře je model schopen odstranit šum z dat. Model s vysokou přesností může mít stále nízké drhnutí, pokud je vysoce citlivý na šum v datech.



