


了解线性回归模型中的粗糙性
清理性是衡量模型消除数据噪声能力的指标。它被定义为残差方差(预测值与实际值之间的差)与原始数据方差的比率。较高的净化度值表明模型在消除噪声方面效果更好,而较低的净化度值表明模型噪声更大。
在您的例子中,您正在使用线性回归模型根据房屋的特征来预测房屋的价格。模型的擦洗性可以计算如下:
擦洗性 = (残差方差) / (原始数据方差)
其中残差方差是预测价格与实际价格之间的平方差的平均值,方差是原始数据的方差是每个特征与其均值之间的平方差的平均值。
例如,如果残差的方差为100,原始数据的方差为1000,则模型的擦洗性为:
擦洗性= (100) / (1000) = 0.1
这意味着模型只能从数据中去除 10% 的噪声,并且预测中仍然存在大量噪声。
重要的是要注意,擦洗性并不衡量模型准确性的指标,而是衡量模型消除数据噪声能力的指标。如果高精度模型对数据中的噪声高度敏感,则其净化性可能仍然较低。



