Как использовать онтологии

У меня есть этот вопрос. Я могу понять, что веб-страницы могут интерпретироваться только людьми, а не машинами. Поэтому мы создаем словари и семантику и представляем информацию в rdf в формате ориентированного графа, чтобы машины могли ее даже интерпретировать. У нас есть субъектный предикат и объект, где субъекты, сказуемые и объекты могут быть uris. Но я запутался, должны ли мы иметь rdf, соответствующий каждой странице веб-сайта, чтобы для интерпретации человеком люди могли видеть веб-страницу, но машины могли использовать версию rdf. Я прав?

Также я видел, что, используя разработку онтологий, мы генерируем правила, используя анализ правил ассоциации. У меня тоже есть некоторая путаница в этом. Допустим, я хочу создать онтологию для домена, скажем, медицинского. Затем я использую интеллектуальный анализ правил ассоциации, я анализирую веб-сайты или другие данные, чтобы получить некоторые ассоциации. Но при этом я могу только определить отношения между понятиями. Как я могу получить сам новый концепт с помощью этого майнинга?

Также как мы можем использовать эти вновь созданные онтологии. Мы должны добавить их на сайт как? Я не понимаю. Нужны предложения?


person rajan sthapit    schedule 30.03.2012    source источник
comment
Возможно, вы могли бы указать, какую проблему вы пытаетесь решить. Каков ваш вариант использования? Если вы хотите и имеете достаточную мотивацию, вы также можете прочитать книгу, которая многое прояснит в отношении онтологий, здесь: workingontologist. организация   -  person castagna    schedule 31.03.2012


Ответы (1)


Но я запутался, должны ли мы иметь rdf, соответствующий каждой странице веб-сайта, чтобы для интерпретации человеком люди могли видеть веб-страницу, но машины могли использовать версию rdf. Я прав?

RDF — это модель данных, которую, как и реляционную модель, можно использовать для хранения всех видов информации. Его не нужно прикреплять к веб-странице. На самом деле, он может существовать даже независимо от Сети. Веб-страницы могут встраивать данные RDF непосредственно в HTML-код (с помощью RDFa), поэтому вам не обязательно нужны разные представления для людей и машин. HTML-страницы могут быть полностью отделены от данных RDF, но машины могут быть направлены в нужное место разными способами, например, по ссылке в заголовке веб-страницы или с помощью семантическая карта сайта.

В кругах связанных данных вещи должны быть описаны с использованием HTTP URI для их идентификации. Когда вы ищете URI, вы должны получить описание вещи, и в этом случае считается хорошей практикой предоставлять RDF для программных приложений, которым он требуется, и HTML для пользовательских агентов, взаимодействующих с людьми (например, веб-браузер). . Например, если вы перейдете на http://dbpedia.org/resource/Lyon в своем веб-браузере, вы получаете это. Если вы перейдете к тому же URI с помощью поискового робота, вместо этого вы можете получить это.

Как я могу получить сам новый концепт с помощью этого майнинга?

Разработка онтологий и разработка правил — разные вещи. Обычно онтологии разрабатываются без анализа правил. Концепты обычно возникают в результате соглашения между людьми, которые хотят разработать онтологию для определенной цели. Тем не менее, можно угадать новые концепции из процесса анализа, возможно, анализа текста или анализа правил ассоциации. Но это не относится к тому, как использовать онтологии.

Также как мы можем использовать эти вновь созданные онтологии.

Большую часть времени вы используете онтологии, просто используя термины онтологий. Например, предположим, что вы хотите описать Джима, человека, полное имя которого Джеймс Д. Гу. В RDF вы знаете, что идентифицируете вещи с помощью URI, поэтому вам понадобится URI для Джима, скажем, http://yourdomain.com/jim, сокращенно yd:jim для краткости (для этого вам нужно выбрать собственную схему URI). Теперь вы хотите сказать, что Джим — человек. Для этого у вас есть специальный предопределенный предикат rdf:type:

 yd:jim  rdf:type  <aClassThatRepresentsPeople> .

Теперь вы можете создать новый собственный URI для <aClassThatRepresentsPeople>, но здесь в игру вступают онтологии. Класс людей будет использоваться снова и снова, поэтому вы хотите, чтобы это был термин, который разделяют многие. Чтобы использовать термин онтологии, вы можете просто написать ее URI. Вам не нужно ничего особенного, объясняющего, откуда взялся этот термин, или заявления об импорте. Поскольку URI должны быть универсальными, ясно, что вы используете тот же самый термин, который определен в онтологии. Более того, если онтология следует рекомендациям по связанным данным, URI класса должен быть разыменованным, чтобы при поиске URI с помощью HTTP GET вы получали определение термина. То же самое и с именем Джим. Вы хотели бы сказать что-то вроде этого в RDF:

yd:jim  <theNameAttribute>  "James D. Goo" .

Здесь вам не нужен URI для самого имени, которое представляет собой просто строку символов (хотя можно было бы дать ему идентификатор, чтобы вы могли разложить его на имя, отчество, фамилию и т. д.). Опять же, для <theNameAttribute> вы просто повторно используете свойство, определенное в онтологии. В итоге у вас может получиться что-то вроде этого:

yd:jim  rdf:type  foaf:Person .
yd:jim  foaf:name  "James D. Goo" .

где foaf: — это префикс онтологии FOAF, популярной для описания людей в Интернете.

Мы должны добавить их на сайт как?

Не совсем, но в какой-то степени да. Вы можете повторно использовать существующую онтологию (например, FOAF), которая находится на совершенно другом веб-сайте. В этом прелесть Интернета и связанных данных: они распределены и имеют модульную структуру. Но если вы используете свою собственную онтологию (скажем, http://yourdomain.com/ontology), вы должны сделать эту онтологию доступной через разыменование, то есть, если вы просматриваете термины онтологии (например, http://yourdomain.com/ontology#person), ваш сервер должен ответить описанием онтологии или, по крайней мере, запрашиваемого срока. Вы просто добавляете онтологию так же, как любой файл на свой сайт.

person Antoine Zimmermann    schedule 06.04.2012