Как стать автором
Обновить

Как мы обновили поисковые подсказки в Яндексе и нашли для них правильную метрику

Время на прочтение 9 мин
Количество просмотров 22K
Всего голосов 67: ↑66 и ↓1 +65
Комментарии 38

Комментарии 38

О свеженаболевшем:
Передайте пожалуйста тем, кто занимается поиском в Яндекс навигаторе, если человек едет из Волгограда в Астрахань, то не надо кидать его сразу на Ямал или в Питер при запросе «Газпром». Да и адреса за десятки тысяч километров есть смысл показывать ниже, чем те, которые рядом. Покажите как работает поиск на карте у гугла. Он ищет вдоль проложенного маршрута или при выборе участка карты появляется кнопка «Найти в этом районе». И ещё он показывает сколько времени займет заезд на заправку, цены в отеле, только открытые сейчас заведения и много чего ещё очень удобного. Только вот карта у гугла хуже, чем ваша на основе народной, поэтому по городам есть смысл ехать уже по вашему, так хоть есть более свежие дороги и разговорчики помогают.

Удачи вам.

P.S. А сейчас наоборот при попытке найти Газпром в Москве, меня тут же кидает в Волгоградскую область даже не предлагая варианты.
Добрый вечер!

Сейчас поиск учитывает вашу текущую область просмотра карты, поэтому, конечно же, такого поведения (как перекидывание из Москвы в Волгоградскую область, например) быть не должно – видимо, это был баг. При передвижении карты результаты поиска обновляются с учетом нового спана карты. Чтобы отловить возникшую у вас ошибку, нам понадобимся немного данных – если есть возможность, пожалуйста, перейдите в «Меню», затем «О программе» и 5 раз нажмите на логотип, в буфер обмена скопируется отладочная информация. Ее нам лучше всего отправить на адрес службы поддержки app-navigator@support.yandex.ru

А что касается в целом улучшения сценария поиска в Навигаторе – учета текущего маршрута, фильтров, цен и пр., то тут согласен, будем развиваться

Спасибо, что пользуетесь :)

Вопрос не в тему, но, может быть, вы подскажете: а зачем вообще используется столько разных доменов (yandex.net, yastatic.net и так далее)?
Почему нельзя всё разместить на yandex.ru?

Разные задачи:

  1. yandex.net — организация сетевой инфраструктуры;
  2. yastatic.net, yandex.st — cdn со всей статикой сервисов;
  3. yandex.ru, yandex.by, yandex.ua, yandex.com и т.д. — непосредственно сервисы, доступные пользователям с привязкой к стране по tld.
Спасибо.
Распределить нагрузку по разным DNS-серверам, так понимаю.
Я не самый главный специалист по сетям, но проблематика тут примерно понятна и состоит из двух частей. Первая — историческая: расселить все имеющиеся сервисы на новые адреса — не за один день делается. Вторая — содержательная: единый балансер означает единую точку отказа, DDoS на один сервис затрагивает сразу и все остальные. Скажем, тот же саджест из-за своих RPS может кратно повышать нагрузку на балансеры.

Ещё остаётся добавить, что это не всегда оправданно. По сути, выигрыш для пользователя здесь заключается в экономии сетевых хендшейков и прочего, что в каких-то случаях существенно — например, для саджеста, который должен откликаться на каждую новую букву,
или для поиска, от скорости получения результатов которого радикально зависит качество пользовательского взаимодействия. В других случаях выгоды от этого могут быть неочевидными.
Коллеги, а почему в блоге такой технологичной компании такие страшные мутные скриншоты в век, когда у всех 4K и retina?
Валидный вопрос. К сожалению, речь идет о временах очень давних по айтишным меркам, и приходилось довольствоваться скриншотами двухлетней давности, которые удалось случайно сохранить. Во многом, этот пост возник еще и как попытка сохранить то, что иначе исчезнет навсегда :)

Старый код время от времени приходится удалять, поэтому восстановить состояние сервиса на произвольный момент времени в прошлом невозможно.

Впрочем, в следующих статьях речь пойдет о менее отдаленных временах, поэтому качество картинок неминуемо улучшится :)

поисковые подсказки экономят людям около 60 лет
Ага, прям чуствую что помолодел настолько что даже ещё не родился.
Как называется тот раздел невероятно сложной математики, который даёт эти числа?
Ну, если вы каждому из миллиона пользователей экономите секунду, получается миллион сэкономленных секунд, как-то так :) Тут речь идёт об экономии в масштабах всех пользователей, а не каждого конкретного.

Но это совершенно ужасный способ впечатлить большими числами, по которым совершенно непонятно как те были расчитаны, особая маркетинговая статистика.

Да нет же, это способ понять, почему важно биться за доли секунды выгоды для пользователей в массовых сервисах. При этом указано ведь, что это число из другой статьи, в которой достаточно подробно объясняется, о чем речь.

При этом с моей стороны было бы глупо отрицать толику маркетинга ;)
Да, привести методику расчета не повредило бы.
Шестьдесят лет экономии для всех пользователей в день? В месяц? В год?
Повторюсь, что это написано в статье, ссылка на которую присутствует в том же абзаце, что и число: habrahabr.ru/company/yandex/blog/160749
Недавно мы посмотрели на наши данные и выяснили интересный факт. В совокупности люди задают Яндексу 100 миллионов вопросов в день. Если отключить поисковые подсказки, то в сумме все эти пользователи потеряют 60 лет. Это время уйдёт у них на формулировку запроса, его возможное исправление и новую формулировку после того, как они не нашли того, что им нужно. Получается, что если учитывать среднюю продолжительность жизни в России, каждый день саджест позволяет не потерять жизнь одного мужчины.

Таким образом, ответ: в день.
НЛО прилетело и опубликовало эту надпись здесь
Чтобы все было честно, надо было использовать правильную размерность. Не 60 лет, а 60 человек·лет. Это рабочее время одного человека за 60 лет, или 1 год 60 человек, или 1 секунда у 80 млн человек.
О, Яндекс, привет!
Я понимаю что я вообще не по адресу, но никто другой (даже ваша поддержка) не отвечает на этот вопрос: когда вы планируете Punto под Mac OS починить?
Punto работал и работает под High Sierra. Насколько я помню, проблемы были только на одном из «средних» dp/pb выпусков. На последующих выпусках beta проблема была решена. И, кстати, вы же в курсе, что давно вышел release?
Пунто работает некорректно и в релизе, у меня есть несколько неопубликованных постов в поддержке (не знаю почему они их не публикуют) где поддержка признает проблемы и обещает когда-то их исправить. Постам уже больше полугода.
Удалите и не мучайтесь.
Отличное решение. Прям в нашем стиле.

Поисковые подсказки. Хмм… Только что проверил, простите великодушно, не удержался =)


Заголовок спойлера

Такова жизнь :) Думаю, после вот этого запрос стал очень популярен.
Давайте я поправлю вашу ссылку
Спасибо!
Скажите, а можно как-то вообще задизеблить глобально эти подсказки от слова «совсем»? Можем там, куку какую секретную надо создать? Очень уж они мешают. Ну и до кучи: ya.ru с какого-то времени (уже довольно давно) перестал отправлять запрос по ентеру при отключенных скриптах. :-(
В подсказках Яндекса используются прямые ссылки, которые ведут на сайты, без страницы поискового результата. Это удобно, но очевидно, что уменьшает доходы компании (меньше показов рекламы). Останется ли этот функционал в подсказках?
Конечно! :)
Интересно, какая технология составляет ядро backend-а саджестов Яндекса? Используется ли тут, например, СlickHouse?

В такого рода задачах невыгодно использовать сколь-нибудь general purpose решения, т.к. они гарантированно будут в разы или даже на порядки хуже специализированной структуры данных. В нашем случае, например, нужно держать десятки тысяч RPS, время ответа на уровне десятков миллисекунд, при этом успевать делать ещё некоторую специфическую постобработку результатов (скажем, формирование пословных подсказок). Ну и ещё нужно экономить память, потому что нам нужно, чтобы на каждую машинку помещалось как можно больше подсказок.


Коротко говоря, основная структура данных в саджесте — по-особому плотно упакованный бор, некоторые узлы которого помнят, какие подсказки являются самыми вероятными для конкретного префикса.


Бывают и другие структуры — скажем, для хранения крайне редких подсказок мы используем другую структуру, т.к. позволяем себе в этом случае знать намного меньше информации про каждый запрос, и это позволяет упаковывать данные ещё плотнее.


Возможно, однажды расскажем об используемых алгоритмах в отдельной статье :)

Да, популярность сервиса рождает смысл не популярного backend-а. Обратная сторона медальки.
Спасибо за рассказ. Тема такая интересная, что с статьями не переборщить.
ok ;)
Спасибо за интересную статью! Теперь несколько снисходительнее начинаешь реагировать на периодический трэш поиска — его просто делают лучше)))
Подсказки улучшаются прям на глазах (особенно с мобильного заметна разница).
Однако бывают странные вещи. Например, при вводе названия компании, появляются подсказки без введенного слова image
Например: к «синэо» подсказки «синэо экспертиза; синэо сайт; синэо новости; ...» и вдруг без названия компании просто «цена отзывы» — по клику на который естественно ни одной релевантной страницы с искомой компанией.
Как так??
Да, любопытный случай. К сожалению, это ошибка в нашем опечаточнике: он считает, что слово «синэо» с некоторой вероятностью является опечаткой и исправляет его на слово «цена». Передал этот пример коллегам!
Зарегистрируйтесь на Хабре , чтобы оставить комментарий