Litiy 17 июл 2011 в 15:48

Создание семантического веб-приложения

6 мин

17K

Ruby on Rails*

Туториал

+61

Комментарии 30

hardex 17 июл 2011 в 17:59

Спасибо вашим дипломным руководителям доценту Д.В. Попову и А.Ф. Галямову, что поддерживают выбор интересных и перспективных тем… в отличие от 99% остальных ):

zizop 22 июл 2011 в 10:33

Кстати, а почему у вас два научрука?

Litiy 22 июл 2011 в 13:03

Формально – один. Фактически – оба очень помогли в этой работе.

int03e 17 июл 2011 в 18:39

Крутой диплом, если бы все были такими интересными :-)

sylvio 17 июл 2011 в 19:54

Для обработки RDF ниболее натуральный язык — Prolog :)
Еще один шаг к скайнету.

-3

Litiy 17 июл 2011 в 20:17

Я достаточно хорошо знаю пролог, писал на нём интеллект для шашек(кстати, надо бы написать об этом), он хорош как часть ризонера, но не как основной язык программирования приложения. Есть такие ризонеры, которые поддерживают его, можете ознакомиться на w3c.

0ex0 17 июл 2011 в 20:08

Не пожалели, что выбрали Ruby? После полученного опыта, остались бы вы на этом языке для решения практических задач в этой области?

Litiy 17 июл 2011 в 20:18

Для решения практических задач – да, безусловно. Для решения научных задач, ИИ и вообще для работы с онтологическими БЗ – основным языком пока должен быть java, т.к. там есть все инструменты, которых тут очень не хватало.

stas_agarkov 18 июл 2011 в 02:20

Уточните, пожалуйста, каких именно инструментов не хватало?

Litiy 18 июл 2011 в 02:37

Ну например Sesame API изначально на Java. Jena/Jade для работы с семантиквебом и интеллектуальными агентами – очень мощные инструменты. Ризонеры, майнеры, всё на яве. В данной работе всего хватало, но ИИ/ЭС, системы которые основаны на инженерии знаний я бы стал разрабатывать исключительно на Java.

xyu 18 июл 2011 в 07:12

Можно использовать и руби и любой другой язык вместе с этими библиотеками, хотя руби не пробовал, но вот Scala отлично работает с Jena, и во многих местах скала удобней чем руби.

Litiy 22 июл 2011 в 02:48

Ну может потому что Skala это все-таки JVM ориентированный язык и заточен для работы с Java-системами. У каждого – своя сфера применения. Ruby выбран как эффективный язык для быстрой разработки веб-сервисов.

Source 23 июл 2011 в 15:40

А JRuby не пробовали? Это как раз JVM ориентированная имплементация Ruby.

Litiy 23 июл 2011 в 23:52

Пробовал, хорошая штука, разница с 1.8.7 только в подключении модулей на си, скорости работы, подключении java-классов. Но не использовал его в своих проектах и не могу сказать насколько это удобно, было бы интересно узнать.

Bregor 17 июл 2011 в 20:24

… в более удобном для чтения/записи/хренения…

Litiy 17 июл 2011 в 20:55

поправил уже, спасибо

SerrNovik 17 июл 2011 в 20:39

Интересная тема, безусловно. Может не нашел, но где у вас реализуется логический вывод в реализованной архитектуре? sasame сам по себе не умеет извлекать новые знания из owl аксиом, разве нет?

Litiy 17 июл 2011 в 20:59

Все верно, сам Sesame не умеет, но можно использовать различные бэкэнды, например bigdata.
В приложении тоже нет логического вывода (inference), просто работа с репозиторием/онтологиями и один кастомный SPARQL запрос, который можно с натяжкой считать частным случаем логического вывода.

SerrNovik 18 июл 2011 в 08:39

Я знаю что можно, потому и спрашиваю что у вас, обычно ведь на этом акцентируют внимание.
Спасибо за ссылку на bigdata — когда делал анализ это решение не попадалось — почитаю спецификацию на досуге. Я для Sesame использую OWLIM. Он для научных и разработческих целей бесплатный, но при этом на нем можно работать с большими данными (поддерживает кластер), sparql1.1 и конечно вывод почти на всех аксиомах OWL, а так же неплохую оптимизацию хранения RDF.

MpaK999 17 июл 2011 в 21:17

Попов видимо старший, проект интересный вышел.

edhell 17 июл 2011 в 23:17

Много лет назад экспериментировал с созданием нечто подобного на Jena. Сущности в RDF/OWL были: города, вузы, записи гостевой книги. Забил в онтологию все города и вузы РФ, включил логический вывод уровня OWL DL в Jena… Java грузилась несколько минут и кушала под два гига памяти. Любое изменение онтологии подвешивало Jena на несколько минут (например, добавление записи в гостевую книгу), иногда вылетало с OutOfMemoryError. На этом мои эксперименты с «живым» логическим выводом закончились)

edhell 17 июл 2011 в 23:28

По сабжу встаёт всё тот же вопрос: а в чём сложность было сделать по «старинке» как обычное веб-приложения без SW? Неужели этот sparql-запрос сложно закодить на php/java/ruby + sql?

ЗЫ: Описание сабжа карявое, например, написано «Написаны модели, вьюхи и контроллеры» — а что именно они делают непонятно. Можно только догадываться, что это для веб-интерфейса ввода/редактирования проектов, компетенций и проч. А может и нет…

Litiy 18 июл 2011 в 00:00

Нет никаких проблем реализовать это с помощью классического подхода, но смысл данной работы — разработать прототип и исследовать возможности SW в данной задаче. Все то же самое можно было бы сделать проще и в разы быстрее именно так как вы написали, однако в этом нет никаких инноваций.

Я описал структуру, кроме CRUD интерфейса и вывода результатов здесь ничего не подразумевается, но спасибо за критику.

SerrNovik 18 июл 2011 в 08:50

Судя по комментарию выше, разница в работе не до конца раскрыта, но в ведении в предметную область хорошо показана — меньше работы. Точка хранения с поддержкой логического вывода, формализованная информация о предметной области(онтология) и многие данные «появляются» автоматически БЕЗ дополнительного программирования и лишний сложности работы. Чем сложнее задача тем существенней экономия + существенно облегчается обмен данными между системами. Практический эффект сравним в переходом от бинарного обмена к XML. Ну и в добавок большое количество данных и онтологий доступных в сети и которые надо только скачать и загрузить.

hank 18 июл 2011 в 07:48

Как я понимаю наполнение системы предполагалось делать ручками, но все же интересно, рассматривался ли вариант работы с внешними источниками данных, например mapping RDB to RDF? Все таки на то и Semantic Web, что он обертка над разрозненными источнками данных.

Litiy 18 июл 2011 в 12:31

В Sesame есть встроенный инструмент импорта в разных форматах, а также, например, при наличии нескольких таких систем возможно написание скрипта в три строчки для загрузки данных с различных источников, использующих эти онтологии.
Для RDB to RDF достаточно просто производить render моделей, использующих RDB, в ntriples (или любом другом rdf формате).

Litiy 18 июл 2011 в 12:43

sally 19 июл 2011 в 11:27

Спасибо, очень интересно и красиво написано:) Пойду пройдусь по исходникам на github :) Пишу диссер в этой области, у меня там больше java, меньше рельсов, но, что характерно, — рельсов становится все больше.

Litiy 19 июл 2011 в 13:31

Спасибо. Удачи вам в этом :)
Если вам комфортно писать на java, то в данной сфере это более удобно, как я уже написал.

karenishe 28 июн 2012 в 17:43

А вам интересно коммерческое сотрудничество по части back-end разработки и реализации data mining алгоритмов?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Создание семантического веб-приложения

Комментарии 30

Публикации

Истории