Hiểu và tránh hiện tượng chuẩn hóa quá mức trong các mô hình học máy
Chuẩn hóa quá mức là hiện tượng xảy ra khi một mô hình được huấn luyện quá tốt trên dữ liệu huấn luyện và kết quả là nó trở nên quá chuyên biệt đối với tập dữ liệu cụ thể đó. Điều này có thể khiến mô hình hoạt động kém trên dữ liệu mới, chưa được nhìn thấy vì nó chưa học được các tính năng hoặc mẫu có thể khái quát hóa có thể áp dụng cho nhiều tình huống hơn.
Nói cách khác, quá trình chuẩn hóa quá mức xảy ra khi một mô hình quá phù hợp với dữ liệu huấn luyện và nó không học đủ kiến thức khái quát từ dữ liệu. Kết quả là, mô hình có thể không có khả năng khái quát hóa tốt đối với dữ liệu mới, chưa được nhìn thấy.
Sự chuẩn hóa quá mức có thể do nhiều yếu tố khác nhau gây ra, bao gồm:
1. Trang bị quá mức: Điều này xảy ra khi một mô hình được đào tạo quá tốt trên dữ liệu huấn luyện và nó trở nên quá chuyên biệt đối với tập dữ liệu cụ thể đó.
2. Rò rỉ dữ liệu: Điều này xảy ra khi dữ liệu huấn luyện không đại diện cho phân phối thực sự của dữ liệu và mô hình tìm hiểu các thành kiến và hạn chế của dữ liệu huấn luyện thay vì các mẫu và mối quan hệ cơ bản.
3. Độ phức tạp của mô hình: Điều này xảy ra khi một mô hình quá phức tạp và có quá nhiều tham số so với lượng dữ liệu huấn luyện có sẵn.
4. Thiếu chính quy hóa: Điều này xảy ra khi một mô hình không bị phạt đủ mức vì độ phức tạp và nó được phép điều chỉnh nhiễu trong dữ liệu huấn luyện thay vì các mẫu và mối quan hệ cơ bản.
Để tránh quá trình chuẩn hóa quá mức, một số kỹ thuật có thể được sử dụng, chẳng hạn như:
1 . Chính quy hóa: Điều này liên quan đến việc thêm một số hạng phạt vào hàm mất mát để ngăn cản các trọng số lớn hoặc các mô hình phức tạp.
2. Dừng sớm: Điều này liên quan đến việc dừng quá trình đào tạo trước khi mô hình phù hợp với dữ liệu đào tạo.
3. Tăng cường dữ liệu: Điều này liên quan đến việc tạo ra dữ liệu huấn luyện bổ sung bằng cách áp dụng các phép biến đổi ngẫu nhiên cho dữ liệu hiện có, chẳng hạn như xoay, chia tỷ lệ và lật.
4. Phương pháp tập hợp: Điều này liên quan đến việc kết hợp nhiều mô hình để cải thiện tính khái quát hóa, chẳng hạn như đóng bao và tăng cường.
5. Xác thực chéo: Điều này bao gồm việc chia dữ liệu thành nhiều phần và huấn luyện mô hình trên một phần trong khi đánh giá nó trên các phần còn lại.



