Как стать автором
Обновить

Комментарии 31

Можно добавить, что до сих пор не разрешена ключевая проблема на самой вершине стека технологий — «доверие».

А так — хорошая статья. Поставлю звездявочку в бравзере на случай, если придется объяснить кому про семантик-веб =)
Ну в принципе я написал косвенно о доверии в параграфе о Semantic WEB, вот тут более полный список проблем, которые мешают http://www.well.com/~doctorow/metacrap.htm если коротко, то People lie, People are lazy и People are stupid :D
Кстати вполне решаемая проблема, неправильно ввел метаданные — минус в карму.))) Хабр рулит.
Согласен. Тем более хочется надеется, что к хабру упомянутые выше особенности пользователей относятся в меньшей степени :D
Вопрос в том как в это вовлечь обывателя.
Надо либо софт на другом порту вешать либо какую-то приспособу…
ИМХО не стоит ждать что все кинутся дополнительно размечать свои статьи в RDFе :) но примером удобного применения может быть, например, интернет-магазин: у таких данных уже есть внутренняя структура и очень легко проставить маппинг категорий товаров в RDF-модель. Одно вот только не понимаю: кто же определит эти самые стандартные «понятия»? Как гарантируется, что представление мобильников на разных сайтах будет одинаковое (или любым другим образом понятное машинам)?
Я считаю, что это вопрос времени. Преимущества семантической паутины пока понятны малому количеству людей, но постепенно, с внедрением его во всякие полезные сервисы всё будет становится лучше.
Если один магазин описывает все товары дополнительно в микроформате и активно используется агентами агрегаторов, то количество его продаж будет весьма доходчивым голосом за то, чтобы разобраться и внедрять!

Ну и ещё много примеров можно придумать, как народ начнёт понимать все плюсы данного подхода. Надеюсь моя статья тоже этому поспособствует
Очень даже способствует! :)
А всё-таки, кто же будет определять глобальные понятия? Где-то в документации видел пример винного магазина… но ведь вино нельзя описать одной общей моделью, как всегда — есть несколько подходов, в том числе — с разной степенью подробности :)
во-первых, есть «стандарты де-факто» — кто-нибудь один придумал удачную конструкцию, ее подхватили остальные — вот и готов стандарт.
во-вторых, для онтологий есть возможность «перевода» из одной в другую. Задача не самая тривиальная, но решаемая. Учитывая, что более-менее удачные решения не могут различаться чрезвычайно сильно (обычно, отличие идет на уровне словарей — одни вещи называют разными именами, разные вещи — одними), такой перевод может быть прост. Более того, с развитием семантической паутины и других сервисов на основе онтологий, возможно, будут созданы специальные инструменты для такого перевода. Сейчас, не смотря ни на что, онтологические концепции в ИТ являются очень передовой, а, следовательно, слабо исследованной областью.
Теперь более-менее понятно, спасибо :)
всегда пожалуйста =)
к слову, перевод с одной онтологии в другую во многом напоминает перевод с одного языка на другой. С той лишь разницей, что языки часто имеют различные конструкции, формы которых требуют согласования (без этого получается «моя твоя не понимать»), а в онтологиях все эти моменты уже формализованы и, часто, созданы именно с расчетом на подобные преобразования. То есть перевод получается качественным, а не «лишь бы за конечное время», как в некоторых переводчиках =)
Вот это Вы действительно всё хорошо объяснили. Вообще онтологии должны позволить корректно использовать терминологию незнакомой области, если для неё построена онтология.
А насчёт описания вина, так отличный пример, как раз на разных уровнях онтологии вина и будут интересующие Вас подробности. И даже больше, наиболее низкие уровни будут интересовать возможно только профи — сомелье :D
Хорошая статья. Конечно не школьный уровень, но и я поставлю звездочку.
Да, это не школьный уровень. Вообще это часть моей статьи в рамках научной работы в аспирантуре. Первая часть. Во второй рассматриваю метод Ontology Aware Classifiers описанный в диссертации Zhang J., «Learning ontology aware classifiers» который использует переменные уровни онтологий для автоматического построения классификаторов на основе сырых данных.
Но там много формул и уже не хабровского формата статья.
Я дождался публикации и вот запостил
«XML chemma» решает.
Вообще-то можно было и в личку об этом, но спасибо, исправил. Глаз замылися
> Для решения данной проблемы предпринята глобальная инициатива реорганизации структуры данных Internet в целях преобразования его в Семантическую Паутину
Это утопия. Человеческий фактор все слишком сильно усложняет:)
Согласен на все сто. НО не смотря на этот, такой неудобный фактор, инициатива предпринята ;)
более того, имеет шансы его преодолеть. в конце концов, semantic web направлен на более «человечное» использование информации — по смыслу, а не по буковкам и словам. Просто это пока не отработано.
Честно говоря, совершенно не верю в ручную разметку Интернета пользователями. На уровне отдельно взятого магазина — верю, если хозяин сочтёт, что ему это полезно.
но размечать каждый адрес компании, сигналы светофора и прочее — увольте.

Можно провести простую аналогию: в Ворде есть стили заголовков. Использовать их удобно и правильно — с их помощью можно добиться автонумерации, опираться на автоматическую схему документа и т.п. Но всё равно куча людей тупо ставит 16 жирный шрифт — вот тебе и заголовок.

Мне кажется, перспективнее развивать «умные» алгоритмы анализа текста. в конце концов, человек может вычленить адрес даже без специальной разметки.
Ручная точно не приживётся, а вот автоматизированная да. Больно много плюсов в итоге.
И кстати, семантическая разметка совершенно не мешает развитию средства умного анализа, Web Data Mining'a и Data Extraction'a
Хорошо, если получится :)

Меня порою совсем уж скепсис одолевает относительно извлечения информации из Сети.
Даже если не углубляться в глубины семантики, как только кому-то что-то надо пропихнуть, поиск сразу же становится невозможным.

Наберите ради прикола в Гугле «britney spears free mp3 download» и посмотрите, какова релевантность результатов. Она просто нулевая. Не уверен, что хотя бы один сайт из двадцатки реально даст вам что-либо бесплатно загрузить.

А семантическая разметка — совсем уж обоюдоострое оружие. Это как бы активный призыв: «я такой-то!» А на практике хз что там. Вон в html тоже есть тег meta, и там можно перечислить ключевые слова… да только ни один нормальный поисковик не принимает эти слова в расчёт.

Впрочем, ладно, хватит занудствовать :)
Всё будет нормально! Количество информации в сети удваивается всё быстрей, волей-неволей придётся использовать какие-то инструменты. А альтернатив пока не так и много
Так и получается. Анализ семантической разметки и выделение из нее полезных фактов — задача не менее сложная, чем работа с обычным HTML и текстами на естественном языке.
Относительно ручной разметки — правда, в первую очередь для микроформатов.

Мне кажется, что хозяева чаще бы считали микроформаты полезными, если бы поисковики давали бонусы при ранжировании страницам, в которых релевантная информация содержится внутри соответсвующих типу информации микроформатов — например, имя человека внутри hCard.
На мой взгляд барьеры очень серьезные для развития. Эти проблемы будут решены только когда будет достаточное количество людей, осознающих плюсы семантик веба. А достаточное количество будет только в том случае, если помимо ит-шников этой проблемой проникнуться еще и рядовые пользователи. А вот уж когда эволюция интеллекта в мировом масштабе дойдет до этого, вот тогда и будет семантик веб. Да, статья на хабре — это хорошо, но необходимо еще и пользователям на других блогах, с другими проблемами, которые можно облегчить семантик вебом сообщить об этом в доступной и понятной форме.
Начал писать комментарий, но он получился очень длинным, поэтому выделяю в отдельный топик: Тут
Отличная мысль! Я был-бы только рад такому комментарию к своей статье, но в виде отдельной статьи это выглядит намного лучше!
По поводу содержания, я оставил там своё мнение habrahabr.ru/blogs/sw/79371/#comment_2323576
на хабре явно нехвтает семантических отношений между статьями :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации