Мы генерируем все больше и больше неструктурированных текстовых данных. Основными двумя источниками являются:
- Естественный язык — Боты
- Социальные медиа
На помощь приходят подходы машинного обучения. Давайте рассмотрим некоторые приложения машинного обучения для анализа текстовых данных.
- Преобразование речи в текст и преобразования текста в речь
- Понимание естественного языка (NLU)
- Извлечение сущности
- Классификация домена/намерения для естественного языка
- Кластеризация документов
- Классификация документов
- Тематическое моделирование
- Извлечение ключевых слов
- Анализ настроений
- Сходство документов
Популярные услуги НЛУ:
- Служба распознавания речи Microsoft (LUIS)
- Диалоговый поток Google (Api.ai)
- Лекс Амазонки
- Разговор IBM Watson
- Wit.ai от Facebook
Мы подробно рассмотрим каждый из вышеперечисленных в следующих постах. Быть в курсе.