Веб-скрапинг таблицы данных википедии, но из dbpedia и примеров/очень простых, элементарных учебных ресурсов для создания запросов

Я хотел спросить о части Semantic Web, в частности об использовании DBpedia. В общем, что может и чего не может DBpedia? Я примерно понимаю модель субъект-глагол-объект для чего-то вроде DBpedia. Практически и конкретно говоря, я хочу извлечь из Интернета технические данные (масса, тяга и т. д.), найденные в Страница Википедии о семействе ракет "Великий поход"

Теперь, на данный момент (т.е. насколько я знаю), чтобы найти то, что есть в DBpedia (т.е. как я использую DBpedia для поиска данных), я нахожу то, что меня интересует в Википедии, копируя последнюю часть URL-адреса и скопируйте его в DBpedia (есть ли более сложный метод?), в результате чего страница.

Глядя на эту страницу, я вижу только ссылки на связанные статьи, ссылки и аннотацию.

Помимо моих небольших вопросов выше, мой главный вопрос заключается в следующем: неужели в DBpedia нет таблицы данных, которую я хочу?

Далее, может ли кто-нибудь помочь мне дать несколько советов или указаний по созданию SPARQL или строки запроса для DBpedia? Мне кажется, что никто не знает, как его построить, поскольку нет «каталога» для того, что можно или нельзя спрашивать. Спасибо.


person ernestyalumni2014    schedule 29.08.2015    source источник


Ответы (2)


так что у dbpedia нет таблицы данных, которую я хочу?

Нет, это не так. Обычно DBpedia получает данные из инфобоксов. В вашей статье его нет, поэтому DBpedia не может извлечь из него много информации.

person svick    schedule 29.08.2015

DBpedia — активный проект, и экстракторы DBpedia продолжают развиваться. Вклады, которые могут вам помочь, включают в себя добавление информационных блоков на страницы Википедии и экстракторов данных в DBpedia. Посетите веб-сайт DBpedia для получения информации или напишите по адресу dbpedia-discussion, чтобы начать.

Что касается поиска содержимого DBpedia, есть несколько интерфейсов, с которыми вы можете работать:

person TallTed    schedule 04.09.2015