Как стать автором
Обновить

Дмитрий Муромцев (ИТМО) — об онтологическом моделировании и формировании разговорного интеллекта

Время на прочтение 8 мин
Количество просмотров 7.3K
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 14

Комментарии 14

Очень интересно!
«Графы знаний» чем-то отличаются от «семантических сетей»? Или это как «LG — новое имя Голд Стар»? Или в сеть в общем случае можно запихать всё, что угодно, в «ГЗ» только то, что реально считается знанием, а не просто «рыба живёт в воде, Волга впадает в какое-то море, лошади кушают овёс и сено»…?
По структуре — семантическая сеть может быть одним из представлений графа знаний. С точки зрения логики информации, которая хранится в этом виде, семантическая сеть накладывает лишь одно ограничение — она описывает взаимосвязи между объектами. Для «графа знаний» этих ограничений больше, что именно имел в виду Дмитрий Ильич здесь, я не знаю.
Могу предположить, что для того, чтобы назвать информацию «знаниями», необходимо ввести критерий полноты (насколько полно эта информация описывает предметную область) и самодостаточности (можно ли вывести/описать новое понятие, имея на руках лишь информацию из уже созданного графа). Наверняка есть какие-то дополнительные тонкости.

В любом случае, это понятие явно производное и скорее нужно для идентификации проекта, чем для описания принципиально новой сущности. С точки зрения разработчика, наверное, система с «графом знаний» начинает требовать заметно меньше усилий на поддержку (если выполняется критерий самодостаточности).
… необходимо ввести критерий полноты… и самодостаточности ...
Вот-вот, и я об этом же подумал.
Связались с Дмитрием Муромцевым — вот его ответ:

Под семантическими сетями подразумевают множество методов графовой репрезентации знаний, а также базы знаний, построенные на этих методах. Например, это могут быть концептуальные графы Джона Совы (http://www.jfsowa.com/cg/cgexampw.htm), пропорциональные сети Стюарта Шапиро(https://www.cse.buffalo.edu/sneps/Downloads/) и др. Есть известные ресурсы в формате семантических сетей, которые существуют уже много лет. Например Cyc (http://www.cyc.com), который в наше время доступен в онтологическом формате. Одним из известных формализмов семантических сетей в 80-х был графический язык KL-ONE (http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.545.601&rep=rep1&type=pdf) Рональда Брахмана. В последствии идеи, использованные в этом языке, были применены при разработке языка онтологий OWL. 

Графы знаний — это термин, появившийся сравнительно недавно и предполагает, прежде всего, технологию создания баз знаний на основе связанных данных (linked data и RDF) и онтологий. Также под этим термином понимают и сами базы знаний, созданные с помощью данной технологии. Наиболее известные графы знаний: DBpedia (http://wiki.dbpedia.org), Wikidata (https://www.wikidata.org/wiki/Wikidata:Main_Page), Yago (https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/#c10444), musicbrainz (https://musicbrainz.org) и др.
Примечательно, что в современном своем состоянии база знаний Cyc представлена в проекте http://www.opencyc.org, который тоже корректнее называть уже графом знаний знаний (http://delivery.acm.org/10.1145/220000/219745/p33-lenat.pdf?ip=77.234.203.218&id=219745&acc=ACTIVE%20SERVICE&key=24E52AF21FCA316E%2E4996C6BC452BB88B%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35&CFID=840418762&CFTOKEN=53499921&__acm__=1513246391_9c96d3efb8b3a6d2f02bb2bd2b50856b)
За ссылки на DBpedi-ю и Yago — огромнейшее спасибо!
Так и в чем глубокий смысл подобных конструкций если они могут быть получены и поняты только специально разработанными паттернами. Причем паттерн нужно составлять для каждой конкретной, единичной задачи. Собственно так и работают сегодня все эти Сири, Алексы и прочие Алисы. Ручками прописывают паттерны, ибо самообучатся такое не может.
Странно что кто то вкладывает деньги и время в такой тупик.
Глубокий смысл в том, что если эти самые «специально разработанные паттерны» делать по-уму (читай — по стандарту), должным образом описывать и делиться с другими, то возникнет сеть знаний следующего порядка.
И, как ни странно, «Большие Парни» тоже умеют договариваться. Тогда возникает что-нить типа schema.org или foaf или… да много уже чего работает.
Нет в описанном вами никакого смысла. :(
Паттернов многие миллиарды. И все без исключения они включают целиком или частично другие паттерны, те самые уровни абстракции. Создавать их вручную просто лишено смысла. Вы просто никогда не закончите этот процесс. И уследить возрастающие уровни абстракции это за пределами человеческого мозга.
На начальном этапе своего проекта, я делал визуализации происходящих изменений. После возникновения примерно первого десятка уровней, понимать происходящее уже не возможно.
Не лишено. Смысла, я имею ввиду. В прикладных задачах все, имеющие смысл в данной задаче паттерны «перибираемы» — множество счетное и конечное.
Десяток уровней — да Вы, батенька, гигант! Ноамального человека на 3-5 уровней хватает.
Не перебираемы к сожалению. Либо у вас какие то очень странные задачи. Дело в том что семантика не решает даже простых задач, а просто создает видимость таковых решений. Я предпочитаю работать в сторону алгоритма который сам формирует новые уровни абстракций по мере необходимости. Правда пока не удается решить задачу многопоточной обработки входящего потока, а в один поток все довольно медленно работает.
Я думаю, разница у нас в том, что я — простой пролетарий умственного труда, а Вы — мыслитель со своим проектом. Мое мышлении поплосче будет.

Я уважаю людей, по зову сердца бросающихся на слабо сформулированные задачи. Но по темам Speech Recognition and Ontology мне случилось «покопать отсюда и до обеда» и решать задачи в формулировках работодателя. Своими впечатлениями от этого опыта и делюсь.
Чем могу…

А вот Speech Recognition кстати довольно интересная задача. И пока то что вижу я на базе своего проекта, основная проблема в том что ее отделяют от задачи Voice Synthesis. А при реализации этих задач совместно получается довольно интересно. Собственный голос в подражании слышимым звукам в то же время является и основным паттерном для распознавания.
Основная проблема, что визуализация процесса создания паттернов лишена смысла. Просто трата времени.
Хотя результат обобщения одной детской книги выглядит вот так.

О! Здается мне, нужно переходить в личку…

Блин, только не голосовое управление. Максимум — чтобы брелок мигал и пищал при фразе "Где эти [censored] ключи?", произнесённой с достаточной экспрессией.

Зарегистрируйтесь на Хабре , чтобы оставить комментарий