การทำความเข้าใจและการหลีกเลี่ยงการทำให้เกินมาตรฐานในโมเดลการเรียนรู้ของเครื่อง
การทำให้เป็นมาตรฐานมากเกินไปเป็นปรากฏการณ์ที่เกิดขึ้นเมื่อแบบจำลองได้รับการฝึกฝนกับข้อมูลการฝึกเป็นอย่างดี และด้วยเหตุนี้ ทำให้แบบจำลองมีความเชี่ยวชาญมากเกินไปในชุดข้อมูลเฉพาะนั้น สิ่งนี้อาจทำให้โมเดลทำงานได้ไม่ดีกับข้อมูลใหม่ที่มองไม่เห็น เนื่องจากไม่ได้เรียนรู้คุณสมบัติหรือรูปแบบทั่วไปที่สามารถใช้ได้กับสถานการณ์ที่กว้างขึ้น
กล่าวอีกนัยหนึ่ง การทำให้เกินมาตรฐานจะเกิดขึ้นเมื่อแบบจำลองใกล้เคียงกับข้อมูลการฝึกมากเกินไป และไม่ได้เรียนรู้ความรู้ทั่วไปจากข้อมูลไม่เพียงพอ เป็นผลให้แบบจำลองอาจไม่สามารถสรุปข้อมูลใหม่ที่มองไม่เห็นได้ดีนัก
การทำให้เกินมาตรฐานอาจเกิดจากปัจจัยหลายประการ รวมถึง:
1 การติดตั้งมากเกินไป: สิ่งนี้เกิดขึ้นเมื่อแบบจำลองได้รับการฝึกฝนกับข้อมูลการฝึกเป็นอย่างดี และกลายเป็นความเชี่ยวชาญเฉพาะทางมากเกินไปสำหรับชุดข้อมูลเฉพาะนั้น
2 การรั่วไหลของข้อมูล: สิ่งนี้เกิดขึ้นเมื่อข้อมูลการฝึกอบรมไม่ได้เป็นตัวแทนของการกระจายข้อมูลที่แท้จริง และแบบจำลองเรียนรู้อคติและข้อจำกัดของข้อมูลการฝึกอบรมมากกว่ารูปแบบและความสัมพันธ์พื้นฐาน
3 ความซับซ้อนของโมเดล: สิ่งนี้เกิดขึ้นเมื่อโมเดลซับซ้อนเกินไปและมีพารามิเตอร์มากเกินไปเมื่อเทียบกับจำนวนข้อมูลการฝึกที่มีอยู่
4 การขาดการทำให้เป็นมาตรฐาน: สิ่งนี้เกิดขึ้นเมื่อแบบจำลองไม่ถูกลงโทษเพียงพอสำหรับความซับซ้อน และได้รับอนุญาตให้พอดีกับสัญญาณรบกวนในข้อมูลการฝึกมากกว่ารูปแบบและความสัมพันธ์พื้นฐาน
เพื่อหลีกเลี่ยงการทำให้เกินมาตรฐาน สามารถใช้เทคนิคหลายอย่างได้ เช่น:
1 . การทำให้เป็นมาตรฐาน: สิ่งนี้เกี่ยวข้องกับการเพิ่มบทลงโทษให้กับฟังก์ชันการสูญเสียเพื่อกีดกันน้ำหนักที่มากหรือโมเดลที่ซับซ้อน
2 การหยุดก่อนกำหนด: สิ่งนี้เกี่ยวข้องกับการหยุดกระบวนการฝึกอบรมก่อนที่แบบจำลองจะพอดีกับข้อมูลการฝึกมากเกินไป
3 การเพิ่มข้อมูล: สิ่งนี้เกี่ยวข้องกับการสร้างข้อมูลการฝึกอบรมเพิ่มเติมโดยการใช้การแปลงแบบสุ่มกับข้อมูลที่มีอยู่ เช่น การหมุน การปรับขนาด และการพลิก
4 วิธีการรวมกลุ่ม: สิ่งนี้เกี่ยวข้องกับการรวมหลายแบบจำลองเพื่อปรับปรุงลักษณะทั่วไป เช่น การบรรจุถุงและการเพิ่มขนาด
5 การตรวจสอบความถูกต้องข้าม: สิ่งนี้เกี่ยวข้องกับการแยกข้อมูลออกเป็นหลายพับและฝึกแบบจำลองในพับเดียวในขณะที่ประเมินในพับที่เหลือ



