Teknik Pembesaran dalam Pembelajaran Mesin: Meningkatkan Prestasi dan Mengurangkan Overfitting
Augmentasi ialah teknik yang digunakan dalam pembelajaran mesin untuk meningkatkan saiz set data latihan dengan mencipta contoh baharu daripada set data sedia ada. Matlamat penambahan adalah untuk menyediakan model dengan set input yang lebih pelbagai, yang boleh meningkatkan prestasinya dan mengurangkan overfitting.
Terdapat banyak cara berbeza untuk melakukan penambahan, tetapi beberapa teknik biasa termasuk:
1. Putaran dan selak imej: Memusing dan menyelak imej boleh mencipta variasi baharu input yang sama, membolehkan model belajar mengenali objek dari sudut dan orientasi yang berbeza.
2. Pemotongan dan pelapik: Pemotongan dan pelapis melibatkan mengalih keluar atau menambah piksel pada tepi imej, masing-masing. Ini boleh membantu model belajar mengecam objek walaupun apabila sebahagian daripadanya tersumbat atau hilang.
3. Kegelisahan warna: Menukar keseimbangan warna atau keamatan imej boleh mencipta variasi baharu yang model tidak pernah lihat sebelum ini, membantunya belajar mengecam objek dalam keadaan pencahayaan yang berbeza.
4. Suntikan hingar: Menambah hingar pada imej boleh mensimulasikan variasi dunia sebenar dan membantu model menjadi lebih mantap kepada input bising.
5. Campuran: Campuran melibatkan menggabungkan dua atau lebih imej ke dalam satu input, membolehkan model belajar mengenali objek walaupun apabila ia hadir dalam pemandangan yang berantakan atau kompleks.
6. CutMix: CutMix melibatkan pemangkasan secara rawak sebahagian daripada imej dan menampalnya ke dalam imej yang berbeza, mencipta variasi baharu yang model tidak pernah lihat sebelum ini.
7. Pemadaman rawak: Memadam bahagian imej secara rawak boleh mencipta variasi baharu yang model itu tidak pernah lihat sebelum ini, membantunya belajar mengecam objek walaupun bahagiannya tiada.
8. Pemindahan gaya: Memindahkan gaya satu imej kepada imej yang lain boleh mencipta variasi baharu yang model tidak pernah dilihat sebelum ini, membantunya belajar mengecam objek dalam gaya dan keadaan pencahayaan yang berbeza.
Dengan menggunakan teknik pembesaran, model pembelajaran mesin boleh belajar mengecam objek dan corak dengan cara yang lebih teguh dan boleh digeneralisasikan, yang membawa kepada prestasi yang lebih baik pada data yang tidak kelihatan.



