Как стать автором
Обновить

Комментарии 14

В каждом человеческом языке по несколько десятков тысяч слов, а количество возможных комбинаций из них я вообще боюсь себе представить.
В компаниях, занимающихся предоставлением поисковых услуг, работают лучше специалисты и если бы все было бы просто, то описанных вами проблем не возникало бы.
Работы в сторону понимания смысла контента компьютерами идут полным ходом, но быстро это не получится. Одна из подобных попыток — это Семантический веб — почитайте, думаю будет интересно.
Вообще, в принципе, если не говорить о высоких материях, а только применительно к данному случаю,
то это вполне можно решить с помощью метаязыка запросов, например:
"Диссертация: поиск" - вполне можно соотнести "Дисертация" с идентификатором сущности, а "поиск" - с частью содержимого, причем элементарно.

Идея вообще интересная.
Стоит подумать над реализацией.
...и кстати наверняка такое уже есть, хотя лично я тоже не встречал)
НЛО прилетело и опубликовало эту надпись здесь
Метаинформация нам поможет.
Мы же ведь уже давно используем теги в навигации.
Те же теги можно использовать и в строке поиска.
имеется в виду, как я понимаю, сложность при индексировании страниц сайтов, где поиск должен осуществляться, а не в строке поиска. Там, действительно, не сложно... А вот при индексировании нужно определять какое слово что означает, это может утяжелять и усложнять весь процесс.
Хм. какое слово что означает..
А что может означать для машины слово дисертация? Или поиск?
Это просто поток байтов и всегда им останется.
Человек должен структурировать информацию. ЧеЛоВек.
Для себя. В понятных себе терминах.

Функция машины - выявлять неочивидные человеку отношения и свойства этих структур,
и на базе этого строить новые, позволяющие человеку получать наиболее релевантную информацию.
Машине всеравно как слово диссертация относится к слову поиск.
Они имеют смысл только для человека. Причем даже не для каждого.

Вы хотите научить машину человеческому языку?
Я думаю, в ближайшие лет сто это нереально. Хотя бы только по тому, что человек пока
не понимает как работает сам прототип, то есть, его собственный мозг.

Но зато вполне реально указать машине явно отношение двух этих слов,
используя понятные машине термины.

Поэтому и считаю, что метаинформация в данных + язык запросов - это наше все;)
диссертация/+2 по теме поиск
хм, и впрямь действует )) жаль только, что не достаточно релевантно и приходится спрашивать: а как мне найти это?...
Ну я с вами согласен, рецепта на все случаи жизни нет, но часто помогает знание языка запросов:
http://help.yandex.ru/search/?id=481939
спасибо, читал. Неудобные они, но для конкретных целей типа этой вполне сойдут как вариант.
alexandreyev, спасибо, действительно познавательно

Wild_Deer, хм, да это сложно, но переводчики же так и поступают...
Гораздо легче научиться самому(человеку) правильно формулировать запросы для поисковика, чем поисковик научить понимать то что на самом деле хочешь найти.
на мой взгляд главная задача поисковика выдавать актуальные и точные ответы на твои запросы.
Но если ты хочешь создать ИИ - то поисковик может стать неплохим инструментом для этого, но не более.
Лучше реализовать поддержку регулярных выражений
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории