Memahami Scrubbiness dalam Model Regresi Linear
Scrubbiness ialah ukuran sejauh mana model dapat mengeluarkan bunyi daripada data. Ia ditakrifkan sebagai nisbah varians baki (perbezaan antara nilai ramalan dan nilai sebenar) kepada varians data asal. Nilai scrubbiness yang lebih tinggi menunjukkan bahawa model lebih baik dalam mengeluarkan bunyi, manakala nilai scrubbiness yang lebih rendah menunjukkan bahawa model lebih bising.
Dalam kes anda, anda menggunakan model regresi linear untuk meramalkan harga rumah berdasarkan ciri-cirinya. Scrubbiness model boleh dikira seperti berikut:
Scrubbiness = (Variance of residual) / (Variance of original data)
dimana varians residual ialah purata perbezaan kuasa dua antara harga yang diramalkan dan harga sebenar, dan varians daripada data asal ialah purata perbezaan kuasa dua antara setiap ciri dan nilai minnya.
Sebagai contoh, jika varians bagi baki ialah 100 dan varians data asal ialah 1000, maka scrubbiness model ialah:
Scrubbiness = (100) / (1000) = 0.1
Ini bermakna model hanya dapat mengeluarkan 10% daripada hingar daripada data dan masih terdapat banyak bunyi dalam ramalan.
Penting untuk ambil perhatian bahawa scrubbiness bukan ukuran ketepatan model, tetapi lebih kepada ukuran sejauh mana model itu dapat mengeluarkan bunyi daripada data. Model dengan ketepatan yang tinggi mungkin masih mempunyai kegosokan yang rendah jika ia sangat sensitif kepada hingar dalam data.



