Koneoppimisen lisäystekniikat: Suorituskyvyn parantaminen ja yliasentamisen vähentäminen
Augmentaatio on koneoppimisessa käytetty tekniikka, jolla kasvatetaan harjoitustietojoukon kokoa luomalla uusia esimerkkejä olemassa olevista. Lisäyksen tavoitteena on tarjota mallille monipuolisempi joukko syötteitä, mikä voi parantaa sen suorituskykyä ja vähentää ylisovitusta.
On olemassa monia erilaisia tapoja suorittaa augmentaatiota, mutta joitain yleisiä tekniikoita ovat:
1. Kuvan kääntäminen ja kääntäminen: Kuvien kääntäminen ja kääntäminen voi luoda uusia muunnelmia samasta syötteestä, jolloin malli voi oppia tunnistamaan kohteen eri kulmista ja suunnasta.
2. Rajaus ja täyttö: Rajaaminen ja täyttö tarkoittaa pikselien poistamista tai lisäämistä kuvan reunoihin. Tämä voi auttaa mallia oppimaan tunnistamaan kohteen, vaikka sen osat olisivat tukossa tai puuttuvat.
3. Värin värinää: Kuvan väritasapainon tai intensiteetin muuttaminen voi luoda uusia muunnelmia, joita malli ei ole ennen nähnyt, mikä auttaa sitä oppimaan tunnistamaan kohteen erilaisissa valaistusolosuhteissa.
4. Kohinan injektio: Kohinan lisääminen kuvaan voi simuloida todellisia vaihteluita ja auttaa mallia muuttumaan kestävämmiksi meluisille tuloille.
5. Sekoitus: Sekoitus sisältää kahden tai useamman kuvan yhdistämisen yhdeksi syötteeksi, jolloin malli oppii tunnistamaan kohteen, vaikka se olisi sotkuisessa tai monimutkaisessa kohtauksessa.
6. CutMix: CutMix sisältää kuvan osan satunnaisen rajaamisen ja liittämisen eri kuvaan, jolloin luodaan uusi muunnelma, jota malli ei ole ennen nähnyt.
7. Satunnainen poisto: Kuvan osien satunnainen pyyhkiminen voi luoda uusia muunnelmia, joita malli ei ole ennen nähnyt, mikä auttaa sitä oppimaan tunnistamaan kohteen, vaikka siitä puuttuisi osia.
8. Tyylin siirto: Kuvan tyylin siirtäminen toiseen voi luoda uusia muunnelmia, joita malli ei ole ennen nähnyt, mikä auttaa sitä oppimaan tunnistamaan kohteen eri tyyleissä ja valaistusolosuhteissa.
Käyttämällä lisäystekniikoita koneoppimismallit voivat oppia tunnistamaan objektit ja kuviot vankemmin ja yleistettävimmällä tavalla, mikä parantaa näkymättömien tietojen suorituskykyä.



