


लीनियर रिग्रेशन मॉडल में स्क्रबबीनेस को समझना
स्क्रबनेस इस बात का माप है कि कोई मॉडल डेटा से शोर को कितनी अच्छी तरह दूर करने में सक्षम है। इसे मूल डेटा के भिन्नता (अनुमानित मूल्यों और वास्तविक मूल्यों के बीच का अंतर) के अवशेषों के भिन्नता के अनुपात के रूप में परिभाषित किया गया है। उच्च स्क्रबनेस मान इंगित करता है कि मॉडल शोर को दूर करने में बेहतर है, जबकि कम स्क्रबनेस मान इंगित करता है कि मॉडल अधिक शोर है।
आपके मामले में, आप किसी घर की विशेषताओं के आधार पर उसकी कीमत का अनुमान लगाने के लिए एक रैखिक प्रतिगमन मॉडल का उपयोग कर रहे हैं। मॉडल की स्क्रबनेस की गणना निम्नानुसार की जा सकती है:
स्क्रबनेस = (अवशेषों का भिन्नता) / (मूल डेटा का भिन्नता)
जहां अवशेषों का भिन्नता अनुमानित कीमतों और वास्तविक कीमतों और भिन्नता के बीच वर्ग अंतर का औसत है मूल डेटा का प्रत्येक फीचर और उसके औसत मूल्य के बीच वर्ग अंतर का औसत है। उदाहरण के लिए, यदि अवशेषों का भिन्नता 100 है और मूल डेटा का भिन्नता 1000 है, तो मॉडल की स्क्रबनेस होगी:
स्क्रबनेस = (100) / (1000) = 0.1
इसका मतलब है कि मॉडल डेटा से केवल 10% शोर को हटाने में सक्षम है, और भविष्यवाणियों में अभी भी बहुत अधिक शोर मौजूद है। यह ध्यान रखना महत्वपूर्ण है कि स्क्रबनेस नहीं है यह मॉडल की सटीकता का माप है, बल्कि यह माप है कि मॉडल डेटा से शोर को कितनी अच्छी तरह दूर करने में सक्षम है। यदि उच्च सटीकता वाला मॉडल डेटा में शोर के प्रति अत्यधिक संवेदनशील है, तब भी उसकी स्क्रबनेस कम हो सकती है।



