Comments 37
На первой картинке неправильность запроса определяется тем, что слово «битва» пишется с двумя «т»? Не, ну так конечно ничего не найдётся.
Так нашлось или не нашлось? На картинке написано «не найдено», вы в комментарии говорите «нашлось» — что за разброд и шатания??

И почему я должен играть в логическую игру «угадай в чём неправильность запроса». Хорошо, я понимаю, что автор хотел показать движок слева (типа лучше ищет) и справа (типа хуже ищет).
Так вот я и думаю, почему движок ищет лучше: потому что обратный порядок слов (это прямо бросается в глаза), а потом вдруг присматриваюсь и вижу: «Ба! Да там слово написано неправильно».

Ну вот и объясняйте теперь, почему справа лучше ищет:
1. Потому что порядок слов неправильный
2. Потому что там слово написано неправильно
3. Потому что одновременно пункт 1 и 2
4. Потому что справа настраивали крутые специалисты и как не пиши — слева будет хорошо, а справа не найдётся ))))

А то вместо этого вы пишете, что нет, уважаемый, в первом столбце всегда ищется — а во втором столбце один раз тоже нашлось!!!

В общем, взрыв мозга. Дихотимии поделены пополам слишком криво: люди делятся на левшей, правшей и голубоглазых. Аналогия понятна?
Возможно. И пять человек поставили минус, не захотев объяснить — и вы тоже не собираетесь ничего объяснять, хотя и смайлик поставили. Ну хорошо, я знаю, что я не всезнающий — я спокойно отношусь к тому, что я видимо лишний в этой беседе. Надеюсь, что другим всё будет понятно. Прошу прощения, что глупость написал.
Да тут и объяснять то особо нечего. Запросы слева неправильные из-за наличия в них ошибок, о чем вам сообщили отдельно. И не находится по ним нигде кроме максим-онлайн из-за настроек поиска, об улучшении которых и идет речь далее в статье. Вроде бы все если не очевидно, но трудностей точно не вызывает.
Нужно сделать масштабируемый проект — используем MongoDB
Нужно сделать масштабируемый проект — не используем Монгу.
про это мы тоже напишем, Монга — база не без проблем, скажем прямо
Дочитав до конца статью, начал сомневаться, на техническом ли я ресурсе хабрахабр.
Не думаю, что эту статью заминусуют — но следующий кто захочет повторить этот приём в ближайшем времени рискует в нехилый минус уйти.
может быть наоборот статьи на хабре станут этаким шоу, с завлекухой вначале и one more thing в конце ) шучу
На сколько помню, на хабре не мало статей встерчалось и с сиськами и котами, даже не убранными под хаб.
Если без шуток, статья интересная, спасибо. У меня возник вопрос, не связанный напрямую с содержанием. Не боитесь, что на вас maximonline наедут за использование фото с сайта? Они в правилах запрещают брать материалы без письменного согласования. Я без претензий — правда интересно, почему вас это не смущает.
Это Вера Воронина из сериала Воронены. Кисегач играет Светлана Камынина.
Основная идея следующая. Генерируем для каждого слова из словаря набор триграмм, те. 3 последовательно идущих символов.

Что то мне подсказывает что получился алгоритм сравнения похожести двух документов по шинглам http://habrahabr.ru/post/65944/
И вот доказывай потом коллегам, что читаешь статью на тему текущего рисерча :)
Пожалуйста, улучшите встроенный в почту поиск. Сколько раз им ни пользовался — ни разу ничего не нашёл, приходилось искать в списке, тратить время. Если там есть поиск — он должен работать.
представим, что его напишут неправильно «Лос Анжелес биттва». Как видно, пользователь не знает точно, как пишется имя города

И видимо никогда не узнает, так и будет писать «Лос Анжелес». А потом люди удивляются откуда берётся столько безграмотных.
Кстати да. Есть такое дело, обратная сторона упрощения жизни
В своё время реализовывали с другом поисковый движок — обходились лишь стандартными алгоритмами СУБД MySQL. Ваш «Лос Анженес Бидва» нашелся бы прекрасно, как не коверкай. Краткая суть:
1. Режем «плохие» слова (союзы, описания, и т.п.)
Боль в галаве -> галаве
2. Переводим строку в транслит
galave
3. Осуществляем поиск по SOUNDEX каждого слова
OR ( SOUNDEX( r.phrase ) LIKE SOUNDEX( '$word' ) )
Этот поиск вытягивает из базы «правильные» слова и заменяет ими «неправильные», тем самым нормализуя запрос (двумя зайцами можно убить и склонение существительных)
galave G410 -> голова (golova) G410
4. Теперь осуществляем релевантный поиск через MATCH AGAINST
кстати интересно, это может быть выход для тех кто не хочет/не может (shared хостинг) ничего кроме mysql
пятничные сиськи — это практика с лепры ) тут так не принято )
Only those users with full accounts are able to leave comments. Log in, please.