Pull to refresh

Comments 20

Возникает вопрос: Ну и?
Что с этого? Будет опять таки какой нибудь всемирный каталог, предположим Гугл. И что? И разве сейчас нет каталогов?... с обложками, названиями и краткими описаниями?
UFO just landed and posted this here
Увы, но в реальности этот "ГигантскийГлобальныйГраф (ц)" будет содержать хорошо если несколько процентом информации, доступной в вебе... Остальное - через Google, Яндекс, далее везде...
UFO just landed and posted this here
Нельзя объять необъятное (Козьма Прутков)
но нужно стремиться к этому.
стремиться к недостижимому?
IMHO XML выдача появилась от бессилия людей запрограммировать поисковые системы на глубокий анализ сайтов. В идеале люди вообще не должны думать о всяких тупых оглавлениях. Форматирование (не из художественных целей) должна делать машина. К сожалению сейчас это объективно невозможно.
Думать не должны. Должны пользоваться не задумываясь — интуитивно.

Глубокий анализ чего? Контента произвольного, никому, кроме автора, не известного формата?
Глубокий анализ чего? Контента произвольного, никому, кроме автора, не известного формата?
Да. Это идеальный вариант. Жаль сейчас пока невозможный.
Веб — не книга. Сайт — книга. А Веб — интерактивная библиотека.
Но это всего лишь метафора, не надо интерпретировать так буквально.
Локально есть масса семантических сетей - например, Википедия и другие вики-проекты.
А глобально это и не реализуемо и не нужно реально.
Самое забавное что подобные проекты существуют уже лет пятнадцать. И они неизбежно кончались "пшиком". Кажется первый из них - Gopher. Правда заключается в том, что подобная "структурированная" библиотека не имеет шансов заменить неструктурированную. Просто никаких. Но она имеет шанс оказаться удачным "окном" в мир. Примеры - Yahoo!, Rambler, etc.
Первые попытки создать самолет тоже, вероятно, оканчивались провалом :)
Семантическая сеть - это всего лишь красивая теория. На данный момент повсеместному внедрению семантической сети препятствуют два фактора: теоретический (ущербность окнцепции) и практический (отсутсвие средств реализации). Остановимся на факторах подробнее.
Как сказал какой-то умный дядька из Гугла (фамилию не помню), семантическая сеть не застрахована от подмены информации (на обложке написано "книга" - открываем, а внутри - фанера). Частично эту проблему рашает стандарт dtd (document type definition), но если какой-то васяпупкин описал свой собственный тег, то никто ни от чего не застрахован. Это, что косается теории.
На данный момент в рамках технологии XML существует великое множество технологий, реализующих узкоспециализированные задачи. Все эти технологии взаимосвязаны, и большинство из нах основаны на синтаксисе XML, но некоторые языки имеют отличные от XML синтаксисы. Консорциум w3 постоянно придумывает альтернативы этим узкоспециализированным инструментам. Что-то переводится на синтаксис XML, что-то затачивается под юникод 3, что-то упрощается или усложняется. И конца и края этому не видно. Это,что касается практической реализации.
Из реально работающих инструментов, подходящих под парадигму веб 2.0, сейчас можно назвать только rss и atom.
Конечно, есть мощные построенные на технологиях ajax, например, google, но это единичные inside разработки крупных компаний.
Если бы ребята из w3 не мнили чебя царями-и-богами, идеологами веб 2.0, а разрабатывали реальные вещи, то "библиотеки 3.0" никогда не случилось бы, да и вообще аналогия с библотекой неудачна. Там всегда есть кого наказать на несоответствие данных и метаданных (если только это не ваша домашняя библиотека). В интернете такое несоответствие встречается на каждом шагу, и спрашивать не с кого.
Надо начинать тогда с инструмента, который даст возможность понять с кого спросить. Сделать то несложно - большая тройка GYM(google, ...) создают единое хранилище сертификатов, с помощью которых можно подписывать свой контент для веба. Эту самую подпись вставлять в какой-нибудь новый html-тег, окамляющий подписанное. Ну и те кто подписал свое получают бенефиты от поисковиков чтобы подписывать был смысл. Через некоторое время будем иметь контент, за который народ готов ответить и можно переходить к семантическому этапу.
Видимо, уважаемые коментаторы не понимают сути семантической сети и не знают что такое html.

Объясню: семантическая сеть, это такая система структурирования данных, в которой данные описаны посредством метаданных. К поиску это имеет лишь косвенное отношение, а прямое отношение она имеет к анализированию того, какую информацию получает юзер, юзерскими же агентами. То есть, софт должен: а - однозначно рендерить страницу (формализованный язык), б - "анализировать" полученную информацию однозначно, посредством dtd.

Далее, корневые сертификаты в основном провайдит W3 (ну они ж идеологи, цари и боги), а всё остальное - гуглонет, яхунет и так далее, это не то.. это частные случаи, инсайд разработки крупных компаний.

Теперь о html. Придумайте ка мне html тег? На то, чтоб стандартизировать html тег уходят годы... десятилетия. В принципе, эта проблема решается так: XML -> RDF -> RDFS -> OWL -> XHTML... сложновато, не правда ли? Зато ThrueЪ. К тому же, ещё с год назад был RDF, а щас уже SPARQL. Круто да? Всё переделывать?

Имхо, это как перенаправление сибирских рек в азию среднюю для орашения хлопковых полей. Тогда это был союз поэтов и учёных... а щас, писак и идеологов. И результат на лицо - отдельные оросительные каналы рботают, но чтоб реки развернуть... харизмы у идеологов не хватает.

Почему фишеров со спамерами трудно найти? не наказать, а хотябы найти? Вот потому и нормального dtd банка не будет в ближайшей перспективе. Либо это будет держаться на авторитете организации и работать в немногих инсайд разработках, либо это будет тугообновляемое неповоротливое решение, в котором все плюсы валидности сведутся на нет бюрократией, либо это будет то же самое что и до того, библиотека с пустыми обложками, а раз так, то зачем что-то менять, если оно уже так? Надо придумать правильнее..
>Видимо, уважаемые коментаторы не понимают сути семантической сети и не знают что такое html
Это вообще к чему? Уважаемые комментаторы сроду не собирались обсуждать семантические сети, т.к. по большей части согласны с верхним коментарием. Уважаемые коментаторы всего лишь высказались по поводу полного бардака в инете и предлагают начинать с него.

>Теперь о html. Придумайте ка мне html тег?
Хмм. Сейчас лень вспоминать чего там используется во всяких микроформатах, там вроде обычные DIV можно использовать. Но уже сейчас есть возможность сказать - "это мой адрес - div class="addr" ", "это название книги - ...", ... Там явно не по 10 лет ждали. Не вижу большой проблемы с прописыванием - "а это цифровая подпись для...".

>Далее, корневые сертификаты в основном провайдит W3 (ну они ж идеологи, цари и боги), а всё остальное ....
Сразу видно что вы больше теоретик. Надо делать и не косится на "богов", тем более которые изначально облажались. Именно по этому этим должны заниматься GYM, W3 возможно понадобится чтобы эта троица смогла договориться между собой.

>...
ну азиатские поля толи хлопковых толи каких других культур обсждать не интересно

>Почему фишеров со спамерами трудно найти? ...
Не читайте между строк уважаемый коментатор. Никто не призывает с ними бороться. Всего лишь предлагается поощрить добросовестных создателей контента, которые готовы за него ответить. Чуть-чуть поднимать их в поисковой выдаче и спамерам сразу проблем добавится.

P.S. нормально ведите беседу, без переходов на личности. Человек вроде не глупый, не очень вам к лицу.
На личности переходить не собиралась и не собираюсь. Извините, если обидела. Если Вам дейстивтельно интересна тема семантических сетей, можем попробовать продолжить ее конструктивное обсуждение.
Sign up to leave a comment.

Articles