Я сделаю извлечение ключевых слов из документов. Но я не могу, как оценить точность (или точность, напомню), потому что я не знаю об истинности данных. Я хочу оценить точность (или точность, напомню) для моей модели. Есть ли ориентиры?
Существуют ли какие-либо ориентиры для извлечения ключевых слов?
comment
Что вы подразумеваете под извлечением ключевых слов? Вы имеете в виду извлечение наиболее важных слов в предложении, например это изображение
- person Anwarvic   schedule 27.11.2019
comment
Я видел документы (например, TextRank), где они создают достоверные данные с использованием аннотаторов-людей. Таким образом, эти наборы данных могут быть доступны для загрузки.
- person thushv89   schedule 27.11.2019
comment
Существует некоторая база данных Inspec, которая использовалась в статье TextRank. Вы нашли какой-нибудь эталонный набор данных?
- person Pallavi Choudhary   schedule 28.04.2020
Ответы (1)
Для качественного извлечения ключевых слов вам не обязательно нужна истина. Есть также алгоритмы, которые работают без достоверной информации. Вот сравнение различных алгоритмов и их производительности https://monkeylearn.com/blog/keyword-extraction-tools/
person
SeeMatrix
schedule
07.10.2020