Koneoppimisen ylitäydellisten ominaisuuksien ymmärtäminen
Ylitäydellinen viittaa tilanteeseen, jossa malli tai ominaisuusjoukko on liian monimutkainen ja kaappaa dataan enemmän vaihtelua kuin on tarpeen. Toisin sanoen malli tai ominaisuudet pystyvät sovittamaan datan kohinan taustalla olevien kuvioiden sijaan. Tämä voi johtaa huonoon yleistyssuorituskykyyn uudella tiedolla, kun mallista tulee liian erikoistunut harjoitustietoihin.
Ominaisuuksien valinnassa ylitäydellinen tarkoittaa tilannetta, jossa ominaisuuksia on enemmän kuin tarvitaan tietojen tärkeiden muunnelmien sieppaamiseen. . Jos mallissa on esimerkiksi 100 ominaisuutta, mutta vain 20 niistä on todella relevantteja ongelman kannalta, muut 80 ominaisuutta katsotaan ylitäydellisiksi.



