Публикации по теме 'text-mining'


Откройте для себя всеобъемлющие темы Kpop Boy Band BTS с помощью машинного обучения
Пару дней назад я наткнулся на этот пост об анализе текстов песен Тейлор Свифт и подумал, что это будет забавный проект, чтобы попробовать самому на выходных попрактиковаться в интеллектуальном анализе текста. Для тех из вас, кто не знает, кто такие BTS , это корейская группа, которая взорвалась на Западе с тех пор, как стала первой группой Kpop, получившей награду Billboard Music Awards в 2017 году. Хотя я не АРМИ (как называют их фанаты), я отслеживал их релизы с момента дебюта, и мне..

Базовое руководство по НЛП для мультиклассовой категоризации новостей
Обработка естественного языка, машина опорных векторов, TF-IDF, глубокое обучение, простор, внимание LSTM Давайте разберемся, как реализовать подход к многоклассовой классификации текстовых данных в Python путем определения типа новостей на основе заголовков и кратких описаний. Вступление Классификация текста или документа - это метод машинного обучения, используемый для отнесения текстовых документов к одному или нескольким классам из предопределенного набора классов. Система..

Какой длины пиратский флаг?
Какой длины пиратский флаг? Вычисление длины эмодзи в JavaScript Взгляните на следующий пример кода. Можете ли вы догадаться, что может быть на выходе? Сделайте снимок, прежде чем читать дальше! console.log("🏴‍☠️".length); Вывод этого кода на самом деле 5 , что может быть не тем, что вы ожидали. В JavaScript некоторые символы и эмодзи формируются из нескольких единиц кода, что может привести к неожиданным результатам при использовании свойства length ...

Извлечение информации с помощью машинного обучения
Поскольку объем информации, доступной в Интернете, растет с феноменальной скоростью, исследования в области повышения эффективности и действенности извлечения информации и открытия знаний приобрели решающее значение. «Без данных вы просто еще один человек со своим мнением» -В. Эдвардс Деминг Извлечение информации (IE) связано с применением обработки естественного языка для автоматического извлечения важных деталей из текстовых документов. Процесс извлечения информации..

Используйте инструмент текстовых аннотаций для быстрого поиска информации в тексте
Спросите любого, кто имеет дело с большим количеством документов (журналистов, исследователей, аналитиков и т. Д.), И вы поймете, что поиск материала в тексте долгое время был очень трудоемкой частью их повседневной работы. Нужно прочитать тысячи страниц (надеюсь, теперь оцифрованных), но как быстро найти информацию в этой густой горе слов! Инструменты текстовых аннотаций существуют уже некоторое время в той или иной форме. Но в последние годы появилось множество инструментов, которые..

Меры сходства
Многие реальные приложения используют меры сходства, чтобы увидеть, как два объекта связаны друг с другом. Мы можем использовать эти меры в приложениях, связанных с компьютерным зрением и обработкой естественного языка, например, для поиска и сопоставления похожих документов. Одним из важных вариантов использования здесь для бизнеса было бы сопоставление резюме с описанием работы, что сэкономило бы рекрутеру значительное количество времени. Другой важный вариант использования - это..

Анализ настроений отзывов
Быстрый рост данных сопряжен с проблемой их сортировки и анализа и поиска важных идей, когда необработанные данные существуют в графической форме, текстовой форме или в изображениях (структурированных или неструктурированных). Наука о данных, машинное обучение и глубокое обучение находят свое применение в различных областях, таких как поиск мнений в обзорах твитеров, фондовый рынок, системы рекомендаций, обработка изображений, аэрофотосъемка, военные, прогнозирование погоды и т. Д. В..