ความเกินจริงในการเรียนรู้ของเครื่อง: สาเหตุและวิธีแก้ไข
ความเกินจริงเป็นปรากฏการณ์ที่เกิดขึ้นเมื่อโมเดลภาษาหรืออัลกอริธึมการเรียนรู้ของเครื่องอื่นคุ้นเคยกับข้อมูลการฝึกมากเกินไป และเริ่มสร้างผลลัพธ์ที่คล้ายกับข้อมูลการฝึกมากเกินไป แทนที่จะสร้างภาพรวมให้กับตัวอย่างใหม่ที่มองไม่เห็น สิ่งนี้อาจทำให้โมเดลทำงานได้ไม่ดีกับข้อมูลใหม่ และอาจเป็นปัญหาในงานประมวลผลภาษาธรรมชาติ เช่น การแปลภาษา ซึ่งโมเดลจำเป็นต้องสามารถจัดการกับประโยคหรือวลีใหม่ๆ ที่มองไม่เห็นได้ ความโอเวอร์เกินอาจเกิดจากตัวเลข ของปัจจัยต่างๆ ได้แก่:
1. ความเหมาะสมมากเกินไป: เมื่อแบบจำลองได้รับการฝึกฝนกับข้อมูลการฝึกอย่างดีเกินไป โมเดลนั้นอาจมีความเชี่ยวชาญมากเกินไปกับข้อมูลการฝึก และไม่สามารถสรุปกับตัวอย่างใหม่ได้
2 การรั่วไหลของข้อมูล: เมื่อข้อมูลการฝึกไม่ได้รับการปกปิดอย่างเหมาะสมหรือไม่เปิดเผยตัวตน โมเดลสามารถเรียนรู้ที่จะจดจำข้อมูลการฝึก แทนที่จะสรุปกับตัวอย่างใหม่ ๆ
3 ขาดความหลากหลายในข้อมูลการฝึกอบรม: หากข้อมูลการฝึกอบรมไม่หลากหลายเพียงพอ แบบจำลองอาจไม่เปิดเผยตัวอย่างที่หลากหลายเพียงพอ และอาจคุ้นเคยกับข้อมูลการฝึกอบรมมากเกินไป
4 การทำให้เป็นมาตรฐานไม่เพียงพอ: เทคนิคการทำให้เป็นมาตรฐาน เช่น การออกกลางคันและการสลายตัวของน้ำหนัก สามารถช่วยป้องกันไม่ให้เกิดความซ้ำซ้อนโดยการเพิ่มสัญญาณรบกวนให้กับการคาดการณ์ของแบบจำลอง และป้องกันไม่ให้มีความเฉพาะเจาะจงกับข้อมูลการฝึกมากเกินไป
5 การเลือกตัวชี้วัดการประเมินผลที่ไม่ดี: หากตัวชี้วัดการประเมินผลไม่เหมาะสมกับงานที่ทำอยู่ แบบจำลองอาจถูกปรับให้เหมาะสมสำหรับตัวชี้วัดการประเมินผล แทนที่จะเป็นงานจริง ซึ่งนำไปสู่การทำงานเกินจริง
6 จำนวนข้อมูลไม่เพียงพอ: หากปริมาณข้อมูลการฝึกน้อยเกินไป โมเดลอาจมีข้อมูลไม่เพียงพอที่จะสรุปกับตัวอย่างใหม่ ซึ่งนำไปสู่ความโอเวอร์เกิน
7 การปรับไฮเปอร์พารามิเตอร์ไม่ถูกต้อง: หากไฮเปอร์พารามิเตอร์ของโมเดลไม่ได้รับการปรับอย่างเหมาะสม โมเดลอาจมีความเชี่ยวชาญมากเกินไปกับข้อมูลการฝึก ส่งผลให้เกิดการโอเวอร์สเตล
8 การขาดการปรับโดเมน: หากโมเดลไม่ได้รับการปรับให้เข้ากับโดเมนเป้าหมาย ก็อาจไม่สามารถสรุปกับตัวอย่างใหม่ในโดเมนเป้าหมายได้ ซึ่งนำไปสู่ปัญหาที่เกินจริง
เพื่อจัดการกับปัญหาที่เกินจริง สามารถใช้เทคนิคจำนวนหนึ่งได้ รวมถึง:
1 . การเพิ่มจำนวนข้อมูลการฝึก: การให้ข้อมูลการฝึกเพิ่มเติมสามารถช่วยให้โมเดลสรุปกับตัวอย่างใหม่ๆ ได้
2 การใช้เทคนิคการทำให้เป็นมาตรฐาน: เทคนิคการทำให้เป็นมาตรฐาน เช่น การออกกลางคันและการสลายตัวของน้ำหนัก สามารถช่วยป้องกันไม่ให้เกิดความซ้ำซ้อนโดยการเพิ่มสัญญาณรบกวนให้กับการคาดการณ์ของแบบจำลอง และป้องกันไม่ให้มีความเฉพาะเจาะจงกับข้อมูลการฝึกมากเกินไป
3 การใช้ตัวชี้วัดการประเมินผลที่แตกต่างกัน: หากตัวชี้วัดการประเมินผลไม่เหมาะสมกับงานที่มีอยู่ การใช้ตัวชี้วัดการประเมินผลที่แตกต่างกันอาจช่วยให้แบบจำลองสามารถสรุปตัวอย่างใหม่ได้
4 การเพิ่มความหลากหลายของข้อมูลการฝึกอบรม: การให้ข้อมูลการฝึกอบรมที่หลากหลายมากขึ้นสามารถช่วยให้แบบจำลองสามารถสรุปตัวอย่างใหม่ได้ 5. การปรับโมเดลให้เข้ากับโดเมนเป้าหมาย: การปรับโมเดลให้เข้ากับโดเมนเป้าหมายสามารถช่วยให้โมเดลสามารถสรุปกับตัวอย่างใหม่ในโดเมนเป้าหมายได้
6 การใช้การเรียนรู้แบบถ่ายโอน: การเรียนรู้แบบถ่ายโอนสามารถช่วยให้โมเดลสรุปตัวอย่างใหม่ๆ ได้โดยใช้แบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าเป็นจุดเริ่มต้น
7 การใช้วิธีทั้งมวล: วิธีการทั้งมวล เช่น การบรรจุถุงและการเสริมกำลัง สามารถช่วยให้โมเดลสรุปตัวอย่างใหม่ๆ ได้โดยการรวมการคาดการณ์ของแบบจำลองต่างๆ เข้าด้วยกัน



