Разбиране на объркването в машинното обучение
Объркването е мярка за това колко трудно е за модел на машинно обучение да прави прогнози за нови, невиждани данни. Често се използва като начин за оценка на ефективността на модел, особено в ситуации, когато истинските етикети не са известни или са трудни за получаване.
Има няколко начина за изчисляване на объркването, но един често срещан метод е използването на кръстосана ентропия функция на загубата и логаритмичната вероятност на правилния клас. След това недоумението се изчислява като отрицателната логаритмична вероятност на правилния клас, разделена на броя на пробите в тестовия набор.
Недоумението е полезна мярка, защото ни дава представа колко добре моделът може да обобщава нови данни . Ако объркването е голямо, това може да показва, че моделът не върши добра работа за улавяне на основните модели в данните и може да се наложи допълнително коригиране на модела. От друга страна, ако объркването е ниско, това може да означава, че моделът върши добра работа за улавяне на основните модели и може да е готов за използване в приложения от реалния свят.
Объркването може да се използва по различни начини в машина обучение, като например:
* Оценяване на ефективността на модел върху нови данни
* Сравняване на ефективността на различни модели върху едни и същи данни
* Идентифициране на области, където моделът се нуждае от подобрение
* Мониторинг на ефективността на модел във времето
В обобщение, объркването е мярка колко трудно е за модел на машинно обучение да прави прогнози за нови, невиждани данни. Изчислява се като отрицателната логаритмична вероятност на правилния клас, разделена на броя на пробите в тестовия набор. Perplexity може да се използва за оценка на ефективността на даден модел и идентифициране на области, в които моделът се нуждае от подобрение.