Существуют ли какие-либо ориентиры для извлечения ключевых слов?

Я сделаю извлечение ключевых слов из документов. Но я не могу, как оценить точность (или точность, напомню), потому что я не знаю об истинности данных. Я хочу оценить точность (или точность, напомню) для моей модели. Есть ли ориентиры?


person Joo-Young Lee    schedule 27.11.2019    source источник
comment
Что вы подразумеваете под извлечением ключевых слов? Вы имеете в виду извлечение наиболее важных слов в предложении, например это изображение   -  person Anwarvic    schedule 27.11.2019
comment
Я видел документы (например, TextRank), где они создают достоверные данные с использованием аннотаторов-людей. Таким образом, эти наборы данных могут быть доступны для загрузки.   -  person thushv89    schedule 27.11.2019
comment
Существует некоторая база данных Inspec, которая использовалась в статье TextRank. Вы нашли какой-нибудь эталонный набор данных?   -  person Pallavi Choudhary    schedule 28.04.2020


Ответы (1)


Для качественного извлечения ключевых слов вам не обязательно нужна истина. Есть также алгоритмы, которые работают без достоверной информации. Вот сравнение различных алгоритмов и их производительности https://monkeylearn.com/blog/keyword-extraction-tools/

person SeeMatrix    schedule 07.10.2020