Публикации по теме 'lemmatization'
Руководство для начинающих по обработке естественного языка — Часть 3
Токены и N-граммы с оценочными метриками были рассмотрены в Части 2 этой серии статей как введение в НЛП.
В этой статье после краткого обсуждения анализа данных вы найдете:
Маркировка POS. Стемминг. лемматизация.
Что такое парсинг данных?
Традиционный синтаксический анализ предложений выполняется как метод понимания точного значения предложения или слова. Обычно это объясняет важность различных делений, таких как подлежащее и сказуемое. Для компьютера синтаксический анализ..
Вопросы по теме 'lemmatization'
Многоязычный NLTK для POS-тегов и лемматизатора
Недавно я обратился к НЛП и попытался использовать NLTK и TextBlob для анализа текстов. Я хотел бы разработать приложение, которое анализирует отзывы путешественников, поэтому мне приходится работать с большим количеством текстов, написанных на...
10421 просмотров
schedule
28.10.2022
Получение корневого слова с помощью Wordnet Lemmatizer
Мне нужно найти общее корневое слово, совпадающее со всеми родственными словами для экстрактора ключевых слов.
Как преобразовать слова в один и тот же корень с помощью лемматизатора python nltk?
Eg:
generalized, generalization -> general...
8225 просмотров
schedule
24.05.2024
проблема с WordNetLemmatizer() при использовании списка кортежей
Я обнаружил, что есть разница в том, как мы передаем аргумент в WordNetLemmatizer()
Когда я бегу:
m=[('recurrances', 'NNS')]
wnl = WordNetLemmatizer()
print '>>>>', wnl.lemmatize(m[0][0], 'n')
результат "повторения",...
914 просмотров
schedule
18.10.2023
WordNetLemmatizer: Различная обработка wn.ADJ и wn.ADJ_SAT?
Мне нужно лемматизировать текст с помощью nltk. Для этого я применяю nltk.pos_tag к каждому предложению, а затем конвертирую полученные теги Penn Treebank ( http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html ) в теги...
1267 просмотров
schedule
21.03.2024
Почему стемминг\лемматизация в nltk не работает точно на кадре данных pandas?
Я пытаюсь реализовать определение и лемматизацию из пакета nltk в кадре данных Pandas. Я написал следующую функцию, но где-то она не выполняет стемминг и лемматизацию. Пожалуйста, дайте мне знать, какие изменения необходимо внести.
from...
453 просмотров
schedule
17.02.2024
лемматизировать весь столбец, используя лямбда-функцию
У меня есть этот код, проверенный для предложения, и я хочу преобразовать его, чтобы я мог лемматизировать весь столбец, где каждая строка состоит из слов без знаков препинания, например: deportivas calcetin hombres deportivas shoes
import...
392 просмотров
schedule
11.10.2023
TypeError: ожидаемая строка или байтовый объект в лемматизации nltk
Затем этот файл необходимо разбить на предложения, затем каждое предложение — на массив слов, и это можно пометить с помощью nltk tagger. При этом можно выполнить лемматизацию, а затем добавить к ней стемминг. Этот код из ( Как предоставить (или...
98 просмотров
schedule
21.08.2022
Можем ли мы получить для него все возможные леммы с помощью Spacy по заданному слову?
Входное слово является автономным и не является частью предложения, но я хотел бы получить все его возможные леммы, как если бы входное слово было в разных предложениях со всеми возможными тегами POS. Я также хотел бы получить поисковую версию леммы...
54 просмотров
schedule
03.12.2023