Розуміння проблем машинного навчання
Здивування – це міра того, наскільки важко моделі машинного навчання робити прогнози на основі нових, невідомих даних. Його часто використовують як спосіб оцінки ефективності моделі, особливо в ситуаціях, коли справжні мітки невідомі або їх важко отримати.
Існує кілька способів обчислення здивування, але один з поширених методів полягає у використанні крос-ентропії. функція втрат і логарифм правдоподібності правильного класу. Потім обчислюється від’ємна логарифмічна правдоподібність правильного класу, поділена на кількість зразків у тестовому наборі.
Здивування є корисною мірою, оскільки вона дає нам уявлення про те, наскільки добре модель здатна узагальнювати нові дані. . Якщо збентеження високе, це може означати, що модель погано справляється зі фіксацією основних закономірностей у даних, і може знадобитися подальше налаштування моделі. З іншого боку, якщо збентеження низьке, це може вказувати на те, що модель добре справляється із захопленням основних шаблонів, і вона може бути готова до використання в реальних програмах.
Перплексність можна використовувати різними способами в машині навчання, як-от:
* Оцінка продуктивності моделі на нових даних
* Порівняння продуктивності різних моделей на тих самих даних
* Визначення областей, де модель потребує вдосконалення
* Моніторинг продуктивності моделі протягом тривалого часу
Підсумовуючи, збентеження є мірою про те, наскільки важко моделі машинного навчання робити прогнози на основі нових, невідомих даних. Він розраховується як негативний логарифм правдоподібності правильного класу, поділений на кількість зразків у тестовому наборі. Perplexity можна використовувати для оцінки ефективності моделі та визначення областей, де модель потребує вдосконалення.