Величезна кількість інформації представлена в неструктурованому вигляді, і навчитися її використовувати, отже, підвищити ефективність роботи з клієнтами, збільшити продажі, швидко реагувати на скарги, вміти оцінювати результати маркетингових кампаній.
Крім того, грамотний аналіз інформації, представленої в текстовому вигляді (в мережі інтернет та ін.), відкриває додаткові можливості для зростання та розширення бізнесу. Для досягнення цих цілей служать технології Data Mining і Text Mining.
Ключовими групами завдань Text Mining є: категоризація текстів, вилучення інформації та інформаційний пошук, обробка змін у колекціях текстів, а також розробка засобів подання інформації для користувача.
Останнім часом аналіз тексту привертає дедалі більше уваги різних галузях, таких як безпека, комерція, наука.
Цей курс охоплюватиме основні методи вилучення та аналізу текстових даних для виявлення цікавих закономірностей, отримання корисних знань та підтримки прийняття рішень, з акцентом на статистичні підходи, які в цілому можуть застосовуватися до довільних текстових даних будь-якою звичайною мовою з нульовою або мінімальною участю людини.
Детальний аналіз текстових даних вимагає розуміння тексту звичайною мовою, що, як відомо, є складним завданням для комп'ютерів. Однак було показано, що ряд статистичних підходів добре працюють для «поверхневого», але надійного аналізу текстових даних для пошуку закономірностей та виявлення інформації. Ви вивчите основні поняття, принципи та основні алгоритми інтелектуального аналізу тексту та їх можливе застосування.
Github: TMining