Forståelse af forvirring i maskinlæring
Forvirring er et mål for, hvor sv
rt det er for en maskinl
ringsmodel at lave forudsigelser på nye, usete data. Det bruges ofte som en måde at evaluere en models ydeevne på, is
r i situationer, hvor de sande etiketter ikke kendes eller er sv
re at opnå.
Der er flere måder at beregne forvirring på, men en almindelig metode er at bruge krydsentropien tabsfunktion og log-sandsynligheden for den korrekte klasse. Forvirringen beregnes derefter som den negative log-sandsynlighed for den korrekte klasse, divideret med antallet af prøver i tests
ttet.
Forvirring er et nyttigt mål, fordi det giver os en idé om, hvor godt modellen er i stand til at generalisere til nye data . Hvis forvirringen er høj, kan det tyde på, at modellen ikke gør et godt stykke arbejde med at fange de underliggende mønstre i dataene, og yderligere tilpasning af modellen kan v
re nødvendig. På den anden side, hvis forvirringen er lav, kan det tyde på, at modellen gør et godt stykke arbejde med at fange de underliggende mønstre, og den kan v
re klar til brug i den virkelige verden. l
ring, såsom:
* Evaluering af en models ydeevne på nye data
* Sammenligning af forskellige modellers ydeevne på de samme data
* Identificering af områder, hvor modellen skal forbedres* Overvågning af en models ydeevne over tid
Sammenfattende er forvirring et mål af hvor sv
rt det er for en maskinl
ringsmodel at lave forudsigelser på nye, usete data. Det beregnes som den negative log-sandsynlighed for den korrekte klasse, divideret med antallet af prøver i tests
ttet. Forvirring kan bruges til at evaluere en models ydeevne og identificere områder, hvor modellen skal forbedres.