


Memahami Scrubbiness dalam Model Regresi Linier
Scrubbiness adalah ukuran seberapa baik suatu model mampu menghilangkan noise dari data. Didefinisikan sebagai rasio varians dari residu (selisih antara nilai prediksi dan nilai aktual) terhadap varians data asli. Nilai scrubbiness yang lebih tinggi menunjukkan bahwa model tersebut lebih baik dalam menghilangkan kebisingan, sedangkan nilai scrubbiness yang lebih rendah menunjukkan bahwa model tersebut lebih berisik.
Dalam kasus Anda, Anda menggunakan model regresi linier untuk memprediksi harga sebuah rumah berdasarkan fitur-fiturnya. Scrubbiness model dapat dihitung sebagai berikut:
Scrubbiness = (Varians dari residu) / (Varians dari data asli)
dimana varians dari residu adalah rata-rata dari selisih kuadrat antara harga prediksi dan harga sebenarnya, serta variansnya data asli adalah rata-rata selisih kuadrat antara masing-masing fitur dan nilai rata-ratanya.
Misalnya, jika varians dari residu adalah 100 dan varians data asli adalah 1000, maka scrubbiness model adalah:
Scrubbiness = (100) / (1000) = 0.1
Artinya model hanya mampu menghilangkan 10% noise dari data, dan masih banyak noise yang ada dalam prediksi.
Perlu diperhatikan bahwa scrubbiness tidak ukuran keakuratan model, melainkan ukuran seberapa baik model mampu menghilangkan noise dari data. Model dengan akurasi tinggi mungkin masih memiliki scrubbiness yang rendah jika model tersebut sangat sensitif terhadap noise dalam data.



