На смену информации приходят знания

По закону диалектики количественные изменения рано или поздно должны перейти в качественные.

Объемы информации увеличиваются и гуру веба начинают говорить о готовности к качественному скачку развития всемирной сети (см. что говорил Тим Бернерс-Ли о семантическом вебе и web 3.0).

От информации к знаниям

Выделяют следующие качественные уровни представления информации:

1) данные

2) информация

3) знания

Задачи

Для того чтобы получить знания, необходимо представить семантику информации в виде, доступном для машинной обработки.

В связи с этим возникает 2 класса задач:

1) извлечение знаний из имеющихся хранилищ. Само собой, мы должны иметь хранилища и знания, пригодные для машинной обработки.

Сюда относится задача организации семантического поиска, когда в ответ на запрос на ЕЯ машина выдает знания, конкретный ответ, а не ссылки на документы, которые, предположительно, могут содержать информацию, относящуюся к ответу.

2) логический вывод над имеющимися знаниями.

Текущая реализация

Что предлагается на текущем этапе?

1. Есть инструмент описания связей (отношений) между произвольными объектами – RDF.

2. Есть язык описания предметных областей (онтологий) – OWL.

3. Развивается язык запроса к онтологиям – SRARQL.

4. На более низком уровне в современные документы добавляются метаданные о семантике текста.

Получают распространение микроформаты (vCard, hCalendar).

5. Инструменты и стандарты.

Разработаны редакторы онтологий – например, Protege.

Проблемы

И, конечно, есть целая куча проблем:

1. Построение онтологий. Идея разработки онтологий для всех имеющихся у человечества знаний напоминает легенду о Вавилонской башне.

В этом направлении развиваются методы автоматического построения онтологий по текстам на ЕЯ. Используются алгоритмы машинного обучения.

Кроме того разработаны семантические базы данных, онтологии по предметным областям (онтология вин, товаров, медицинская онтология).

2. Единые форматы представления знаний . Идет разработка форматов онтологий для глобального доступа и поиска по всем вновь создаваемым онтологиям.

3. Доверие.

Давным-давно в HTML была предпринята попытка добавить элементы семантики в документы (тег meta), однако бизнес-гонка оптимизаторов SEO дискредитировала этот источник метаданных о содержании документа.

С появлением стандартов RDF и OWL проблема не решается. Остаются вопросы: где гарантия, что источник указал правильную информацию и задал верные отношения между объектами? По каким правилам должны формироваться онтологии?

Отношения между объектами и онтологии можно строить по-разному в зависимости от точки зрения.

Самые сложные проблемы связаны с человеческим фактором:

people lie, people are lazy, people are stupid.

Ссылки

Содержательные ресурсы на русском языке:

Лекции о семантическом вебе

http://company.yandex.ru/academic/class2006/solovyev.xml

Научные публикации о построении онтологий:

http://www.nbuv.gov.ua/portal/natural/ZKhUPS/2009_3/Keberle.pdf

Сообщество разработчиков и исследователей семантического веба:

http://semanticfuture.net/index.php?title=%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0

Блог Щербака:

http://shcherbak.net/

Конференция по семантическому вебу:

http://iswc2009.semanticweb.org/wiki/index.php/ISWC_2009_Research_Track

Итоги

1. На пути развития семантического веба стоят огромные объемы просто структурированной информации,  недостаточно развитые технологии извлечения смысла из текстов на ЕЯ, человеческий фактор.

2. Скорее всего нужно развивать технологии автоматического извлечения смысла из текстов.

3. RDF-разметка и онтологии будут хорошо работать в системах, где нет коммерческого интереса в результатах ответа на запрос (в системах документации, справочниках, обучающих курсах).

1 Comment

Filed under извлечение знаний, семантический веб, OWL, RDF, semantic web

One response to “На смену информации приходят знания

  1. Alexey

    Кать, ты на Yet Another Conference пойдешь, или считаешь ее админской?:)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s