ทำความเข้าใจกับความหยาบในโมเดลการถดถอยเชิงเส้น
ความขัดถูคือการวัดว่าแบบจำลองสามารถกำจัดสัญญาณรบกวนออกจากข้อมูลได้ดีเพียงใด โดยถูกกำหนดให้เป็นอัตราส่วนของความแปรปรวนของค่าคงเหลือ (ความแตกต่างระหว่างค่าที่คาดการณ์ไว้และค่าจริง) ต่อความแปรปรวนของข้อมูลต้นฉบับ ค่าความขัดถูที่สูงกว่าบ่งชี้ว่าแบบจำลองสามารถขจัดสัญญาณรบกวนได้ดีกว่า ในขณะที่ค่าความขัดถูที่ต่ำกว่าบ่งชี้ว่าแบบจำลองนั้นมีสัญญาณรบกวนมากกว่า ในกรณีของคุณ คุณกำลังใช้แบบจำลองการถดถอยเชิงเส้นเพื่อทำนายราคาบ้านตามคุณลักษณะต่างๆ ความขัดถูของแบบจำลองสามารถคำนวณได้ดังนี้:
ความขัดถู = (ความแปรปรวนของปริมาณคงเหลือ) / (ความแปรปรวนของข้อมูลเดิม)
โดยที่ความแปรปรวนของปริมาณคงเหลือคือค่าเฉลี่ยของผลต่างกำลังสองระหว่างราคาที่คาดการณ์ไว้กับราคาจริง และความแปรปรวน ของข้อมูลต้นฉบับคือค่าเฉลี่ยของความแตกต่างกำลังสองระหว่างแต่ละคุณลักษณะและค่าเฉลี่ย ตัวอย่างเช่น หากความแปรปรวนของค่าคงเหลือคือ 100 และความแปรปรวนของข้อมูลต้นฉบับคือ 1,000 ความขัดถูของแบบจำลองจะเป็น:
ความขัดถู = (100) / (1000) = 0.1
ซึ่งหมายความว่าโมเดลสามารถกำจัดสัญญาณรบกวนออกจากข้อมูลได้เพียง 10% เท่านั้น และยังมีสัญญาณรบกวนจำนวนมากในการทำนาย สิ่งสำคัญคือต้องทราบว่าความขัดถูไม่ใช่ เป็นการวัดความแม่นยำของแบบจำลอง แต่เป็นการวัดว่าแบบจำลองสามารถกำจัดสัญญาณรบกวนออกจากข้อมูลได้ดีเพียงใด แบบจำลองที่มีความแม่นยำสูงอาจยังมีความขัดถูต่ำ หากมีความไวสูงต่อสัญญาณรบกวนในข้อมูล



