Розуміння методів видобутку в інтелектуальному аналізі даних і машинному навчанні
Екстракція стосується процесу вилучення або видалення чогось із більшого контексту чи цілого. У контексті інтелектуального аналізу даних і машинного навчання методи вилучення використовуються для вибіркового вилучення відповідної інформації або функцій із великого набору даних замість використання всього набору даних.
Наприклад, під час обробки природної мови методи вилучення можуть використовуватися для вилучення певних ключових слів. або фрази з документа, або для визначення основних тем чи тем, присутніх у тексті. Під час аналізу зображень методи вилучення можуть використовуватися для виділення певних особливостей або об’єктів із зображення, наприклад країв, кутів або форм.
Мета методів вилучення – зменшити складність даних і визначити найважливішу або релевантну інформацію , які потім можна використовувати для подальшого аналізу або обробки. Методи вилучення часто протиставляються методам трансформації, які певним чином змінюють або перетворюють дані, а не просто вибирають певні їх аспекти.



