Pull to refresh

Смысловой поисковый движок UpTake начал свою работу

Reading time4 min
Views795
Original author: Josh Catone

По данным прошлогоднего исследования comScore, планирование поездки и покупка билетов через интернет стала неописуемым кошмаром для готовящихся отдыхать. И причина не в том, что тяжело проводить операции с какими-то сервисами по продаже билетов, а в огромном количестве ненужной информации, с которой приходится сталкиваться при планировании путешествия. По данным исследования comScore, в среднем для того, чтобы составить план поездки требуется воспользоваться 12-ю поисковыми системами, ориентированными на путешествие, посетить 22 веб-сайта: на это уходит обычно около 29 дней. Семантический поисковый проект UpTake (в прошлом Kango) призван облегчить задачу пользователям.

UpTake представляет собой поисковый движок с вертикальной системой поиска, которая обладает крупнейшей базой данных, состоящей из более чем 400,000 отелей и развлекательных учреждений Америки, упоминающихся более чем на 1,000 сайтах. Используя такой вертикальный подход сверху-вниз, UpTake удалось собрать более 20 миллионов отзывов, мнений и описаний отелей и развлекательных заведений США и предоставлять эту информацию по смысловому запросу. Это что-то наподобие Metacritic только для путешественников. Основным критерием поиска является не только рейтинг популярности, UpTake так же пытается охарактеризовать отель или развлекательное учреждение на основе информации, которую поисковая система черпает из базы данных. Например, подходит ли отель для семейного отдыха, годится ли место, информацию о котором вы запрашиваете, для романтического путешествия, приемлема ли стоимость отдыха, и т.д.



«UpTake так же предоставляет пользователю наиболее полезные описания, фото, и т.д. для наиболее подходящих отелей и развлекательных заведений, выбор которых основан на атрибутивном и относительном анализе обзоров и других текстовых данных. Анализ призван на основе нашей онтологии путешествия выбрать наиболее значимые мета-теги», — говорит президент компании Ен Ли (Yen Lee), один из основателей офиса CitySearch в Сан-Франциско и бывший Генеральный менеджер Yahoo! в области путешествий.
С чем нельзя сравнить UpTake, так это с сервисами по продаже билетов, такими как Expedia, с поисковыми сервисами, чей поиск основан на стоимости отдыха (Kayak) или сообществом путешественников. UpTake занимается только лишь сортировкой описаний и семантическим анализом; при помощи этого сервиса невозможно заказать билеты. По данным компании только 14% пользователей формируют запрос о заказе билетов, что символизирует следующее: пользователи больше заинтересованы в изучении мест отдыха, стоимость отдыха для них вторична. Во многих списках на сайте есть возможность проверить рейтинг отеля, данные берутся с сайтов третьих лиц. Так в UpTake планируют зарабатывать.

UpTake работает при помощи специально созданной онтологии путешествий, которая состоит из объектов, связей между этими объектами и правил, по которым генерируется результат, ведь в базе данных 20,000 отзывов и описаний. Эта онтология позволяет UpTake извлекать смысл из структурированной или частично структурированной информации вида «бассейн уровень комфортабельности отеля и дети любят бассейны». Таким образом, отель получит дополнительные баллы, если в его описании встретится фраза «подходит для отдыха с детьми». В данную онтологию так же заложено, что бассейн, в котором плавают обнаженными, для детей неприемлем.
Упрощенная модель онтологии представлена ниже.


В добавок ко всему система учитывает так же и каким вы планируете отдых – романтическое путешествие, семейный отдых или отдых на открытом воздухе – сайт учитывает и душевное состояние для того, чтобы определить, понравится ли пользователю что-то из того, что будет представлено в результатах поиска. Поисковый движок ищет слова с эмоциональной окраской, такие как «нравиться», «любить», «ненавидеть», «забитый» или «с хорошим видом», и на основе этих слов делает вывод о том, нравится отель людям или нет, и что они об этом заведении думают. Все эти собранные данные отражаются в рейтинге, который существует для каждого места отдыха.

Заключение.

Вчера мы на скорую руку протестировали поисковый движок Powerset, основанный на обычном языковом поиске, и обнаружили, что результаты практически не отличаются от тех, что представляет Google. Мы писали о том, что «Google не сдает своих позиций и остается «довольно хорошим» решением, у Powerset уйдет уйма времени на то, чтобы переманить пользователей к себе». Но, не смотря на то, что семантический поиск может показаться пока неуклюжим и громоздким для современной глобальной сети, все равно способен внести большой смысловой вклад в различного рода тематические вертикали. Онтология более ограничена, и такой сайт не пытается отвечать на специфические вопросы, но он обладает возможностью семантического определения концепта, такого как романтичность или, что более важно, определением качества.

Я спросил Ена Ли, что в UpTake думают о вертикальном подходе сверху-вниз в сравнении с традиционным подходом снизу-вверх. Ли ответил, что подход сверху-вниз имеет все шансы для того, чтобы вытеснить подход снизу-вверх из Semantic Web. Ли считает, что попытки подхода сверху-вниз извлечь смысл из неструктурированной или частично структурированной информации, наряду с попытками Yahoo! встроить в индекс семантическую надстройку, побудят публикаторов контента начать использовать семантические модули в информации. Ли так же отметил, что многие партнеры уже обратились в UpTake с вопросом о том, как организовать информацию таким образом, чтобы сервису было легче ее анализировать.

Предполагается, что поисковые сервисы с вертикальной системой, такие как UpTake, помогут более полно представить потребность пользователей и таким образом в семантическом Web будет легче продавать услугу конечному потребителю. Возможность искать среди миллионов описаний и отзывов и заставить, компьютер показать именно то, что вам нужно – вот, в чем главная коммерческая ценность идеи смыслового Web. Когда подобные технологии станут совершеннее, возможно появятся движки, основой которых станет нейролингвистическое программирование, возможно Powerset начнет показывать результаты намного лучше, чем Google (но не стоит забывать ни на минуту о том, что и в Google не будут сидеть сложа руки и ждать у моря погоды…)
Tags:
Hubs:
+19
Comments10

Articles

Change theme settings