A gépi tanulás túlteljesített funkcióinak megértése
A túlteljesítés olyan helyzetre utal, amikor egy modell vagy jellemzők halmaza túl összetett, és a szükségesnél több eltérést rögzít az adatokban. Más szóval, a modell vagy a jellemzők inkább az adatok zaját, mintsem az alapul szolgáló mintákat képesek illeszteni. Ez gyenge általánosítási teljesítményhez vezethet új adatokon, mivel a modell túlzottan specializálódik a betanítási adatokra. A jellemzők kiválasztásával összefüggésben a túlteljesítés olyan helyzetre utal, amikor több jellemző van, mint amennyi az adatok fontos eltéréseinek rögzítéséhez szükséges. . Például, ha egy modellnek 100 jellemzője van, de ezek közül csak 20 releváns a probléma szempontjából, akkor a többi 80 jellemzőt túlteljesítettnek tekintjük.



