mobile theme mode icon
theme mode light icon theme mode dark icon
speech play
speech pause
speech stop

Розуміння скраббінства в моделях лінійної регресії

Скребність – це міра того, наскільки добре модель здатна видалити шум із даних. Він визначається як відношення дисперсії залишків (різниця між прогнозованими значеннями та фактичними значеннями) до дисперсії вихідних даних. Більш високе значення шуму вказує на те, що модель краще усуває шум, а нижче значення вказує на те, що модель більш шумна.

У вашому випадку ви використовуєте модель лінійної регресії для прогнозування ціни будинку на основі його характеристик. Схильність моделі можна обчислити таким чином:

Скраб = (Дисперсія залишків) / (Дисперсія вихідних даних)

, де дисперсія залишків є середнім квадратом різниць між прогнозованими та фактичними цінами, а дисперсія вихідних даних є середнім квадратом різниць між кожною ознакою та її середнім значенням.

Наприклад, якщо дисперсія залишків дорівнює 100, а дисперсія вихідних даних дорівнює 1000, тоді обробка моделі буде такою:

= (100) / (1000) = 0,1

Це означає, що модель здатна видалити лише 10% шуму з даних, і в прогнозах все ще присутній багато шуму.

Важливо зауважити, що стирання не міра точності моделі, а радше міра того, наскільки добре модель здатна видалити шум із даних. Модель з високою точністю все ще може мати низьку обробку, якщо вона дуже чутлива до шуму в даних.

Knowway.org використовує файли cookie, щоб надати вам кращий сервіс. Використовуючи Knowway.org, ви погоджуєтесь на використання файлів cookie. Для отримання детальної інформації ви можете переглянути текст нашої Політики щодо файлів cookie. close-policy