Pull to refresh

Comments 75

Кстати, Игорь, а вам не кажется что поисковые системы как сервис устарели уже очень давно? И любая новая, как минимум обречена на провал, исключая случаи действительных ииноваций, Dulance к примеру. И почему вдруг все ударились в поиск?
Почему все ударились в поиск, понятно.
Есть такая кривая шумихи Гартнера (Hype curve), которая говорит, что сначала новая технология болтается возле нуля, медленно растёт. И никто особенно её не замечает. Потом срабатывает некий триггер (им может быть новое качество или способ зарабатывать деньги на технологии) и начинается бешеный рост. Возникает пузырь - шум, инвестиции, новые проекты, юные миллионеры из гаража и т.п. Потом, на вершине пузыря, срабатывает второй триггер (разочарование) и рост сменяется бурным падением. Проекты лопаются, случайные инвесторы бегут как крысы и т.п. А уже затем внизу дуги падения срабатывает третий триггер и рост начинается снова, но уже на твёрдом основании реального бизнеса.
Так вот в Вебе триггером стал запуск первого браузера Джимом Кларком. Вырос пузырь доткомов, не зарабатывающий денег. Этот пузырь раскручивали все журналисты и аналитики, и на него купились все инвесторы. Потом сработал некий второй триггер и пузырь лопнул. Почему пузырь лопнул (и кто именно его ткнул иголкой) - это более долгий разговор, но это случилось. Потом в самой пропасти падения вдруг включился новый, третий триггер. Какой? А это более-менее ясно - контекстная реклама. Вдруг был придуман способ зарабатывать на Вебе.
Включил этот триггер кто? Правильно, поисковик Гугл. Хотя собственно контекстную рекламу придумали не в Гугле, а в Увертюре.
Вот все и стали неожиданно одержимы поисковиками. Особенно ивесторы, которые привыкли бегать стадами, как лемминги. Мы сейчас находимся в начале или середине второго периода роста Интернета, на реальном твёрдом основании больших денег.

Что касается Дьюланс, я не очень понимаю, была ли там настоящая инновация. Проект куплен Гуглом, не очень задорого (насколько я слышал), автор взят на работу диерктором русского офиса разработки. Какого-то волшебного качества, так, чтобы начать новый пик ажиотажа, этот проект, по-моему, не показывал. Я пробовал искать в нём, ничего не понял. Но уж точно чувства "ух ты!" не испытал.
Хотя в принципе специальные поисковики - это явно будущее.

Да и теги могут быть реальной инновацией, как и обмен запросами или результатами поиска. Может, следует ждать следующего поколения поисковой технологии, которая будет работать не с одной страницей, а разбирать сайт целиком и показывать его в результатах в виде некоторой карты, структуры. Извлечение фактов тоже может дать дорогу новому поколению поисковиков. В общем, идей там много.
Все верно говорите. Но вам не кажется что вот этого твердого основания реального бизнеса у нас почти нет? Честно говоря, на каждый новый поисковик, лично у меня реакция одна: "Селедки" или "Лемминги". Или я чего-то недопонимаю? Ну взять ту же вебальту - да, безусловно, процент рынка она конечно отхватит, да и инвестиций у них хватит, но это только в том случае, если они реальную пользу принесут, а не станут "еще_одним_поисковиком_у_которого_выдача_на_яху/гугл/яндекс_похожа". А пока что все их заявления об инновациях мне кажутся голословными. Рынок поиска (такого, в каком он сейчас виде) давно закрылся. Никто из моих знакомых, не связанных с интернетом напрямую (т.е. не крутящихся в ИТ сфере) даже и не сылшал про гугл. А что уж говорить о тропе, адре, мамонте и вебальте? Яндекс - потому что он яндекс. Mail - потому что там почта. Ramber - не знаю почему, а может и не должен он быть в этом списке :) Апорт? Стукнули новостью что у них все теперь круто, но все уже о них забыли. ИМХО и так много поднабралось, нет?
Что касается Dulance - Имелась ввиду не инновационная технология (может там все вручную отбиралось или шаблоны составлялись, я так сам делаю), а сама идея поисковой машины - т.е. не вот этот размазанный по всему рунету поиск "Цветов", а именно "Где купить Цветы?". Вот этого почему то нет - все погнались за уставревшими идеями и, что прискорбно, технологиями.
Да, и еще мне почему-то кажется, что сейчас у нас сработал первый "триггер" :)
По Вебу вообще - точно третий, а по поисковикам в частности, возможно,Ю и первый. Гартнер рисует свои кривые по отдельным технологиям.

Что касается товарных поисковиков, их в Рунете тоже много. Есть уже пару лет http://www.dash.ru, есть наша незаконченная пока Аппликата - http://applicata.ru, есть Тындекс - http://www.tyndex.ru.
Другие специальные поисковики тоже есть, например, http://iligent.info.
А ещё, например, есть почти триста частных поисковиков, сделанных за это лето на основе бета-версиии нашего Персонального поиска: public.novoteka.ru/all. Там везде как раз чистый тематический Веб, отобранный алгоритмами или вообще руками.
Вот собственно, количество поисковиков все растет и растет. Кстати, идейку вам: с таким ростом неприменно появится спрос на посковики по поисковикам :)
Да, он взял эту тему про "переход от DOS к Windows" с сайта Quintura (www.quintura.ru)
там уже почти год про это написано в их Vision на http://www.quintura.com/ru/quintura/appr…
Получается что он на самом деле за Quintura продвигает их вижн :))
Да-да, конечно. Волшебная Квинтура вообще неземно инновационна, во всем, от пят до кончиков ногтей...

Я, к счастью, могу совершенно точно сказать, откуда я "взял эту тему". Примерно года два назад эту идею высказал Виктор Ремша, гендиректор Финама, когда мы с ним обедали в ресторане и обсуждали инвестирование наших "Поисковых технологий". Я поразился точности формулировки и с тех пор стал её использовать в дискуссиях и докладах.
Я думаю, скоре всего пиарщик Квинтуры как раз подцепил эту простую, но броскую идею с одного из моих выступлений, которых за два года было штук десять на разных КИБах, РИФах, наших конференциях по оптимизации, E-Target-ах и т.п.
Но мне не жалко, пусть пользуются - тем более, что не моё. Да и вообще уже стало общим местом.
Я хотел бы немного дополнить для полноты картины.
Во-первых, я полностью согласен с утверждением, что существенная часть прироста национального доменаиспользуются для спама. Клиенты хостинга перешли уже от вопросов к требованиям сделать API к интерфейсу управления поддерживаемыми доменами, чтобы можно было управлять ими средствами автоматизации клиента. Ситуация "а у вас зарегистрировать 100 доменов можно?" стала обыденной. Т.е. с моей колокольни видно тоже самое :)

Во-вторых, агрессивность поисковиков может привести к некоторой внутренней конфронтации между поставщиками контента и поисковиками. Обратите внимание, я практически нарываюсь на неё. И у меня есть веские основания. Люди, вложившие даже и не огромные деньги на оптимизацию ничего слышать не хотят об увеличившихся нагрузках на сервера. Точно так же они, естественно, я их прекрасно понимаю, ничего не хотят слышать о блокировании индексирования их ресурсов. Да, 1, 2, 10, 50 - возьмут свой сервер, три сервера, четыре... Но 5000 этого делать не будут. Т.е. развитие ситуации обязательно породит конфликт, если не случится чудо. Судя по переписке с некоторыми поисковиками (uni, привет! :), чудо случится вряд ли.

В-третьих, я крайне не согласен с отсутствием вреда от оптимизации. "все сайты, на которые затрачены солидные деньги – это настоящие, живые сайты, с приличным контентом и дизайном" - это, конечно, в некоторой степени так. Но никакой заслуги оптимизаторства здесь нет. Здесь есть заслуга денег и желание удержать клиента, и только некоторое совпадение создаёт описанный ореол благополучности. Что, в принципе, не плохо, конечно. По моей черновой оценке, подавляющее большинство оптимизаторов даже не подозревают что такое "настоящий сайт". "Живой сайт с приличным контентом" в свете оптимизации поиска иногда совершенно противоположен "живому сайту" который нужен для бизнеса. И только молодость этой деятельности (seo) и мода на поиск дают пока желаемый эффект. Что, например, произойдёт, когда одинаково хороших сайтов фирм, работающих в одной нише, в одном месте станет, например, 100? Пойдёт война за каждое слово? А когда таких примеров станет 100? Боюсь, что текущий бум "доткомов", порождённых контекстной рекламой, поиском и взросшей на этом поисковой оптимизацией, и задушит текущее состояние окружения поиска.
Я не говорил о каких-то заслугах оптимизаторов. Владельцы сайтов в любом случае будут что-то делать для того, чтобы быть на первой странице выдачи. Если умеют сами - сделают своими силами, если нет - наймут оптимизатора. Деньги в это будут вкладываться в любом случае.
Надо понимать, что по большинству конкурентных запросов ситуация уже такая, что есть 10-15 мест в выдаче, а оптимизированных, релевантных сайтов, за которые готовы платить деньги - 100 или 200. Возьмите "пластиковые окна", "кондиционеры", "Кипр", "бассейны" и т.п. Заметим, что поисковику всё равно, кто из них сверху - с его точки зрения они почти одинаковы.
Разработчики поисковиков уже не раз проговаривались, что могут вообще включить ротирование первой сотни, не роняя релевантность.

А какой рост нагрузки и по какой причине Вы имеете в виду? Я так понимаю, Вы говорите о ситуации с точки зрения провайдера или хостера. Можете пояснить?
Я полагаю, schors имел в виду возросшую нагрузку от различных поисковых ботов на виртуальном хостинге и нежелание понимать это клиентами (а, соотв., и нежелание переходить на выделенные сервера).
Не надо продавать неограниченные ресурсы :) поисковики - те же посетители сайтов. А если посетителей у сайтов настолько много, что не хватает ресурсов, нужно переходить на другой тарифный план. Правда, другая проблема остается - как это объяснять клиенту, т.к. он это обычно не понимает.
С одной стороны - полностью согласен. И сейчас официальная наша позиция именно такая. Но ты не пробовал объяснять клиенту, отдавшему только что круглую сумму за оптимизацию, что посетители и Яндекс - одно и тоже? (риторический вопрос :) Или форуму phpBB о хомяках, что им придётся платить больше, потому что к нему пришла вэбальта, потом Яндекс, потом Нигма, а потом его выключили? Что нужно им сказать? Отключите индексацию? Да нет, они в принципе хотят чтобы хорошие статьи с их сайта находились в том же Яндексе. Это синтетические посетители. Они действительно не совсем "те же".
Не пробовал. Честно говоря, у нас акселератор с кэшем разруливает 90% проблем с поисковиками.
Проблемы что всё уже лежит пока у нас нет. Практически, я пока вижу проблему по мониторингу нагрузки CPU на лицо. Кэшировать динамику? Ну, хорошо, это оттянет время наступления проблемы. Но, боюсь, только оттянет.
в отложенных todo лежит, необходимости пока не было - кэшировать, если нет жестких expires, не меньше чем на сутки все, что запросил какой-нибудь из роботов и отдавать из кэша другим роботам то же самое.
+1
Т.е. я отстал от жизни... Все вокруг в той или иной степени уже получается оказывают противодействие поисковым роботам... :)
Нет, я же сказал, что мы ничего не оказываем. Кэш для роботов в todo валяется, но даже не знаю, дойдет ли когда-нибудь до реализации
А, извини, не правильно понял. Я грешным делом думал что в todo - мониторинг по нагрузке на CPU. Уф...
Честно говоря у меня вызывает неудомевание, как такой большой хостинг может позволять себе делать подобные заявления? Вы вообще не разбираетесь в проблеме вопроса.

Вы пишите что у вас клиенты приходят с пачками по 100 доменов под спам и вы их размещаете на серверах где сидят обычных клиенты. А вы не боитесь что завтра народ задолбается банить домены по штучно и обратит внимание что у вас всего лишь одна одна класса "C" например и вынесет ее полностью, включая ваших белых и пушистых клиентов?

Я вам по секрету скажу, подобные штуки начали происходить в адулт-дорвей-индустрии с 2001года (см крутоп например), вони было жутко сколько, с тех пор любой хостер берется за дорвеи только если они в разных сетях от основной массы клиентов. Фактически беря дорвейщиков вы подставляете всех своих клиентов и свою компанию, делая это так не умело.

Рассмотрим вариант номер два и опустим сайты пустышки с нагенерированными по 200тысяч страницами, которые например наш бот выкачивает у вас и создает Вам дискомфорт, а вы пишите после этого нам злобные письма про наши алгоритмы работы и так далее...

... сайты у вас приличные, клиенты нормальные, сидят на вируталах, пусть даже по 300 клиентов физически на связку из двух серверов-кластера. В среднем на 1 домене в РУНЕТе находится менее 200 страничек, тоесть всего 60тысяч хитов необходимо сделать нашему боту к вашему 1 серверу за 2 недели.
Вы считаете это много? По 5тысяч хитов в сутки...

Я бы посоветовал Вам пересмотреть свою позицию на вопросы дорвеев, клиентов и поисковых ботов, тк такими темпами все придет к тому, что Ваш хостинг будет просто забанен, а на вопросы владельцев сайтов почему сайт не проиндексирован будет один ответ - данный хостинг забанен и предложение его сменить.
Алексей, извините конечно, но боюсь Вы как-то неправильно меня поняли. Я ни в коем случае не поддерживаю всякий мусор, спам и прочие вещи, и не потакаю им. И не помню, чтобы я это говорил или намекал. Клиенты при этом с пачками по 100 и выше доменов приходят и вопрос существует. Я, к сожалению, одним двумя заявлениями не могу повлиять на общественное сознание. Поэтому, я не знаю, кому была посвящена треть столь импульсивного текста.

Опустим сайты-пустышки? Я правильно понимаю, что тому клиенту я должен написать: "Мы вас выключили по закону установленному неким uni. Ему показалось, что Вы размещаете сайт-пустышку. До свидания, благодарим за сотрудничество." Замечательная идея. Я полагаю клиенты это оценят.

Никак не могу помешать Вам кого-то банить или нет. Если Вы считаете свои обоснования удачными, а результаты бана эффективными - это только Ваш выбор.
Честно признаюсь, Игорь, я боялся негатива с Вашей стороны. Очень рад, что нашёл понимание. Кстати, про ротацию слышу впервые.

Я говорю о нагрузке с точки зрения хостера. Я сталкиваюсь с непониманием проблемы на всех уровнях. Владельцы сайтов зачастую мечтают только о первой позиции в поисковике и слышать ничего не хотят о ресурсах и о настройках индексации. Поисковики обычно как океан - они и не поддерживают агрессивность владельцев сайтов, но и никак не умеряют собственную. Проводить политику "каждому сайту по выделенному серверу" я считаю странной и противоествественной. Я могу провести тут аналогию со спамом - его на почтовые сервера вливается ровно столько, сколько позволяет мощность этих серверов. Увеличиваем - увеличивается поток. Боюсь, что выделенные сервера для каждого сайта оттянут, но не решат проблемы. И остаётся открытым вопрос, а что делать с теми, кто слыхом не слызивал ни о каких поисковиках? Кому в настройках по умолчанию отдать предпочтение? По умолчанию разрешить индексацию, как это сделано сейчас, или запретить? Запрет - это уже противодействие. Более того, я не буду никого сдавать, но мне известны конкретные крупные хостинговые компании, которые уже ввели в действие программное обеспечение противодействия поисковым роботам.
1. Некоторые поисковые боты поддерживают ограничение числа пинков сайта(айпи) через robots.txt, я точно знаю, что это делает яха, т. к. у нас была проблема с досом сервера её ботом.
2. Буквально на днях один из коллег обратил мое внимание на управление кешем браузера через http-заголовки (304 хттп-статус и т. п.), которое многие современные динамические сайты не поддерживают, в то время как боты эти заголовки понимают - им гонять тонны необновившихся страниц неинтересно. Я бы рекомедовал вести разъяснительную работу на эту тему и оказать тех. поддержку, если это, конечно, возможно и оправдано.
3. Банить всякую шушеру - libwww-боты, неизвестные боты, referer-спамеров, всякую неинтересную клиенту экзотику, типа Baidu, и т. п.

Т. е., в-принципе, методы по умерению аппетитов ботов существуют.
Вы, похоже, не представляете масштабов бедствия :) Т.е. практически Вы предлагаете ввести целое штатное подразделение, направленное на противодействие массовому поиску, что увеличит себестоимость услуги. И мы по кругу возвращаемся к проблеме непонимания со стороны клиента.
Я не представляю кол-во и размер хостящихся у вас сайтов.
Если это мало крупных - то можно обойтись тюнингом и консультациями... Судя по вашей реакции - много всяких)))

P. S. Читнул первый пост с комментами в вашем жж - а какой должен быть правильный ответ?
http://www.peterhost.ru/stat.shtml
Только надо делать скидку на то, что многие домены просто припаркованы, а многие сайты имеют по два псевдонима. Где-т на два надо поделить.
Правильный ответ? Не знаю. Знал бы - не спрашивал.
У гугля что-то похожее на такую ротацию давно наблюдается, хотя может быть это побочный эффект из-за расхождений в базах. А есть какие-нибудь причины, по которым ротацию не вводят?
зачем на блокнотик и рупоиск ссылки поставили? не надо им цитирование нагонять...
это еще и опасно: глупый злой поисковый робот забанить может :-) (шутка)
цитирование где? :)
они и так забанены где только можно )
линк на rupoisk не верный
rupoisk.ru
Игорь, а на мой взгляд - процесс и интерфейс именно поиска практически ничем не отличается, что в DOS, что в WIN32. Тот же набор текста, тот же список результатов, только во 2-м случае это происходит в "окне" WIN, а не DOS.

Возможно - ситуацию с мёртвой точки сдвинут методы визуализации результатов (выдачи) и интерфейса поиска?

Позволю себе следующую аналогию (возможно не совсем в 10-ку, но всё-же) - вёрстка сайта ручками на HTML (ручной поиск с определением и уточнением поискового запроса) и конструкторы сайтов - различые редакторы (т.е. поиск с применением средств визуализации) ...

Ваше мнение?
Так они потому и не отличаются, что и тут, и там идея интерфейса поиска одинаковая, на уровне ДОСа.

Линейный поиск, один за раз, в командной строке, на рубленом языке, без возможности задать настоящий "человеческий" вопрос, выдача аутичная, линейная, с кучей технической информации и без по-настоящему нужных данных.

Вот посмотрите на Windows XP. Вы наводите курсор мыши на каталог - вам показывают объём, начало содержания и т.п. А в DOS вам предлагали набрать dir и читать таблицу содержания. Как сейчас в поисковиках.
В Виндах вы можете зацепить в одном окне кусок текста или даже целый объект (хоть каталог, хоть архив) и перетащить в другое окно. Кидаете файл на DVD- y записывается. А в DOS что приходилось делать? Даже в Нортоне?
Аналога drag-n-drop в существующих поисковиках нет - например, объединения или пересечения запросов, откладывания в корзину приглянувшихся результатов, нет уточнения запроса путём помечания в предыдущих результатах того, что уже подходит, ну и так далее. Я бы, может, пощёлкал по словам на найденных сайтах и сделал таким образом новый запрос - но нет возможности.

Нет вопросов на естественном языке, нет сбора результатов в подобие энциклопедической статьи или дайджеста.
Нет настоящей полезной пользователю информации о главном объекте поиска - сайте - его автоматически создаваемой аннотации, дайджеста по всем страницам, сведений о владельце, популряности сайта, его размере - то, что в Виндах давно уже общее место. Вместо этого показывают невразумительную дату, размер в байтах и т.п. - ну как в DOS по команде dir.

Нет истории моих поисков и увязывания, учёта их смысла при новом запросе. Нет возможности создать любимые запросы и пополнять их нажатием мышки, как Favorites в браузере, ну и так далее.

То есть кое-что из этого можно как-то организовать, если есть время, квалификация и острое желание понастраивать Гугль или Яндекс, но это мучительно, а большая часть может быть сделана только на стороне сервиса.
Ну, как с языком запросов - он мощный, да, но в стиле DOS, для инженеров. Вот и пользуются им 1-2%. Помните, были в MS DOS такие escape-последовательности? В 1985-1990 годах считалось шиком ими владеть. Batch-фалы писать и т.п. - и всё это должен был уметь обычный пользователь. Я помню, Фигурнов этой ерунде посвящал целые главы в своём руководстве.
Пока не появились Windows, где ничего этого не надо и серии руководств "Для чайников".

Да, кое-что уже появляется -пресс-портреты в Яндексе,портрет сайта в Гугле (пробегал скриншот) и т.п. Как перед приходом Виндов уже начали потихоньку то тут, то там использовать мышку, графические интерфейсы, кнопочки, и даже WYSIWYG.

Я именно переход к новому пользовательскому интерфейсу поиска с описанными и другими "фичами" и называю созданием Windows для поиска.
Как то не вяжется у меня в голове сравнение поисковиков с операционными системами. Поисковик на мой взгляд это штука несамоценная, которая в идеальном случае интерфейсно должна быть незаметной на фоне найденной нужной информации. И в этом смысле по-моему предел совершенства уже достигнут - аскетичный интерфейс в виде текстовой строки и кнопки "искать".
А по поводу поискового спама, фильтров и всяких нововведений - по-моему петух для традиционных универсальных поисковиков уже прокричал. Их функции уже кластеризуются и реализуются отдельными частями в специализированных сайтах. И надо сказать что пользоваться этими специализированными сервисами в этих самых отдельных случаях намного удобнее. Я например уже пользуюсь универсальными поисковиками скорее в исключительных случаях, когда не могу найти нужную информацию в узком наборе информационных сервисов. Например самые лучшие фильтрованные новости текут по RSS из блогов. Т.е. фильтрация через социальную сеть уже вроде как работает. Вот на данную статью я набрел по фразе "всем меняют фамилию на «Ашманов» и отправляют в окопы" из блога Антона Носика :) Тематическую информацию лучше искать на соответствующих сайтах, а не пытаться разгребать кучи мусора в выдаче.
А всякие феньки в виде дополнительных сервисов у поисковиков использовать не очень удобно. С моей точки зрения они как и сами поисковики концентрируются на универсальных технологиях поиска и представления его результатов. А мне как пользователю нужна конкретная информация, желательно в самом удобном для использования в этом конкретном случае виде. И на сложности у разработчиков с побочными эффектами универсализации типа "аутичных листов" глубоко плевать.

Вот кстати одно из отличий области операционных систем - в смысле возможностей кастомизации они изначально социальны и популярной операционную систему делает
в первую очередь армия разработчиков, а потом уже пользователи. Это кстати на мой взгляд может быть одним из направлений развития поисковиков. Было бы здорово если бы любой разработчик мог реализовать новый сервис на технологической базе Гугла например. Т.е. Гугл уже стал бы операционной системой, разработчики на его основе построили бы город новых забавных узкоспециализированных сервисов. И всем стало бы лучше, включая естественно простых пользователей. Вместо Доса универсального, но тупого сервиса, появилась бы XP - большой каталог узкоспециализированных и по всякому кастомизированных более мелких сервисов.

А, так вы заходите к нам на
Персональный поиск
и делайте свой поисковик - это как раз оно самое и есть.
Там всего под тысячу тестеров, а публичных поисков 280 с гаком. Что уже авторы поисковиков сделали и опубликовали, можно посмотреть
тут
. Довольно прикольно, если полистать, чего только люди не придумают, каких только интересов не бывает.

Общий каталог и и "поисковик поисковиков" выкатим осенью.
Ну похоже конечно, но все таки немного не то. Не уловил чем эти "поисковики" друг от друга отличаются кроме совокупности индексируемых сайтов. Скажите остальным Ашмановым, пусть хоть сделают выдачу в XML чтоб можно было через XSLT менять форму для содержания :)

Мне больше интересно было бы например поковырять уже набитые данные через аналог гугловского map-reduce например, а потом и визуализировать результаты своим способом. Датамайнинг с нуля это та еще проблемка, а на существующем фреймворке типа гугловского можно такие задачи довольно просто реализовывать, вот о чем речь. Так что всякие API к поисковикам и персональные поиски а-ля гугловский поиск по сайту это на мой взгляд конечно здорово, но это как раз и есть пока командная строка на черном экране.
Отличаются именно набором сайтов - и отсутствием дорвеев. Кроме того, вот-вот выкатим версию,где можно будет вести свой каталог сайтов и выдача будет показывать тоже по категориям. Ну и поверх этого будет общий поисковик с рейтингом авторов и поисков - когда-нибудь.

Выдача в XML - есть, но платная. По очень простой причине - поисковик с XML-Ем - это способ быстро делать узкотематические дорвеи. Поэтому открывать XML мы пока опасаемся.
Согласен - предложенные Вами "фичи" помогут повысить качество и, что немаловажно, юзабилити использования поисковых сервисов.
К вопросу "зачем это надо" - поисковик с реализованными вышеприведёными плюсами, на мой взгляд, привлечёт дополнительно очень большой поток пользователей - в первую очередь именно за счёт удобства.

Хотел немного развернуть свою мысль из первого коммента - вместо того, чтобы разгребать кучу технически перегруенных результатов поиска (представленных в виде списка плохо структурированных кусков текста) - ищущий работает с визуальной моделью, отражающей пространство результатов поиска, в т.ч. визуально же отображая структуру данного пространства. Например: простарнство результатов поиска представлено в виде 3д-модели скаем шара, который имеет сектора с разным цветом - скажем один цвет - сайты с 100% попаданием запроса, другим - от 50 до 100, далее например по фактуре - отображаются типы найденых документов и т.д.

Аналогию из жизни попробую такую (хотя она не бытовая) - вместо того, чтобы прочитывать горы бумажной документации и отчётности по организации, бизнес-консультант работает с моделью бизнес-процессов, отражающей как бизнес-логику, так и содержащую разичные функциональные элементы. Работе с моделями бизнем-процессов, кстати, а именно их чтению и пониманию те же руководители компаний учатся очень быстро.

Работает ли кто-либо в этом направлении?
Тутубалин -- супер. молодец. знает, какие книги надо читать.
Было бы прекрасно увидеть пост от мистера Ашманова, про то как он организует своё время и успевает писать такие подробные комментарии, и не только на хабре.

Интервью интересное, данке шён.
+1

Наверное, за него иногда пишут "и партнеры" :)
Нет, партнеры не пишут. :)
Вообще, из партнеров только Тутбалин более-менее активно участвует в дискуссиях.
Клонирование! =)
он сам говорил "...приписку Ашманов и в окопы..."
вы лучше скажите когда будет работать кнопка избранное и добавление понравившихся комментариев в избранное. (ясень пень вам сложно все сделать сразу, но комменты и статьи "реально начнут получать свой вес в ваших попугаях"). :)

(отображение "№" - в комментах исправили? как с "ё" - проблема там...)
пару часов назад я еще чуствовал на зубах песок Синая..
А тут сразу переключиться и сделать "избранные".. не по зубам это мне =)
И ближайшую неделю я буду фиксить баги и делать фичи по списку (что накопился за 2 недели)
А потом сразу сделаем и избранные =)
Битте шён.
Я не организую время каким-то особым способом, а просто пишу быстро.
Я лично сам удивляюсь на блогописателей в ЖЖ, например. Вот уж где времени навалом. Там такие есть громадные человекоподобные боевые роботы с такой чудовищной огневой мощью, что лучше даже не смотреть, а тихо прокрадываться мимо.
Форма ложки за тысячу лет не изменилась, может быть не стоит менять и поисковый интрефейс? Может быть уровень DOS как раз и удовлетворяет большинсто потребностей. А значит что бы разработать и внедрить новый интерфейс необходимо народ убедить что у него уже появились новые потребности. Современные поисковики неплохо справлются с ПОИСКОМ информации, а господин Ашманов хочет от них что бы они ОТВЕЧАЛИ на вопросы, заданные человеком. Но Мне кажется не стоит смешивать эти столь различные задачи. Машина,программа, бот, которая научится отвечать на на такие вопросы должна просто использовать уже существующие поисковики и многое другое.
Нет, плохо они справляются с задачей, раз уж в моду вошли всякие кубки по поиску. Поиск не должен вызывать затруднений. текущий формат подачи посикового запроса при таком объеме индекса + поискового спама никакой критики не выдерживает.
А форма колеса тоже не изменилась за тысячу лет? А Вы подойдите, посмотрите на колесо у ближайшей телеги от Toyota. Я уж не говорю про форму огнива от Zippo.
А насчёт того, что с поиском они справляются неплохо - это несколько оптимистичное утверждение. Вы поищите что-нибудь популярное, да вот фентермин хотя бы...
Но, в общем, спорить тут нечего - если кто-то в мире поисковиков выкатит спички вместо кресала, мы это сразу увидим.

P.S. Я, кстати, знаю пару парней, которые начинали в ВЦ РАН работать на ПК ещё году этак в 1983-1984. А пот м я видел, как ещё году в 1993 такой компьютерный первопроходец, увидев на компьютере Windows, нахмуривался, начинал сопеть и искать кнопку для выхода в командную строку. А уж там набирал dir, и ему сразу становилось легче. Norton Commander, кстати, он тоже безжалостно выгружал, чтобы не мешался. Потому что это всё лишнее, баловство, окна там всякие, кнопки.
Я писал не про форму а про суть. и главной мыслью было что ПОИСК информации и ОТВЕТЫ на вопросы это разные вещи. отвечая на вопросы можно использовать поиск информации, а можно и не использовать.
А что огниво от зиппо и колесо от тойета научились делать принципиально новые вещи, может думать?
Еще вы сетуете на то что по запросу "цветы" в верхних результатах выдается только доставка по москве. А я думаю какой вопрос такой и ответ :). Вы в своем поисковике что выдаете -доставку цветов в мухосранске? Если надо что то найти надо более точно формулировать запрос например - доставка цветов мухосранск. А то если так не делать получится как в анекдоте -
Василий Ивановичь на подводной лодке кричит Петке - трубка 15
Петька отвечает - гайка 54
ВИ - что гай 54?
Петка - а что трубка 15?
Странно, что ни один поисковик пока не сделал две таких простых вещи:
1) Поиск в вопросах пользователях. Чтоб можно было найти наиболее лучший и эффективный запрос.
2) Фильтр для поиска по размеру сайта. Т.е., например, искать только в "больших сайтах", где более 1000 страниц. Или по посещаемости сайта фильтр, хотя может Рамблере это есть, но я им не пользуюсь совсем :)

Жаль, что все считают что для поиска нужна только одна строка ввода и кнопка "Искать"!
О! Так ведь это же практически и есть поисковик по поисковикам :)
Игорь, Вы говорите, в числе прочего, что поисковикам необходима тематическая классификация результатов. Так почему бы для этого не использовать технологии из Новотеки? Она отлично справляется с классификацией новостей, почему бы не применить ее для обычных страниц?
давно старо но все же (по поводу интерфейсов)

Из книги: «Персональные ЭВМ в инженерной практике», М. Радио и связь, 1989.
Одним из примеров громоздкой и, по мнению авторов, бесполезной
надстройки является интегрированная система WINDOWS фирмы Microsoft.
Эта система занимает почти 1 Мбайт дисковой памяти и рассчитана на
преимущественное использование совместно с устройством типа «мышь»...
Таким образом, читатель уже понял, что среди надстроек над ДОС бывают
довольно бесполезные системы, которые только выглядят красиво, а на
самом деле отнимают время пользователя, память на дисках и оперативную
память ЭВМ. Обманчивая красота таких систем, однако, сильно
воздействует на неискушенных пользователей, которые не имели практики
работы на машине. Инерция мышления бывает столь сильна, что авторам
приходилось наблюдать, как люди, начавшие работать с подобной
надстройкой, впоследствии с трудом заставляют себя изучать команды
ДОС. Хочется предостеречь от этой ошибки читателей ...
а если серьезно, то смотрел я тут какой-то фильм годов 70-х
и с удивлением обнаружил на полке у хозяйки порошок tide с
той самой желтой надписью New в уголке, который (порошок)
и сегодня все тот же tide, все тот же new. В добавок,
недавно изучал новый офис 2007, и в очередной раз понял,
что 90% пользователей вполне достаточно использовать excel 5.0
под windows 3.11 (и в плане интерфейса, и в плане функций, надежность
3.11 отдельно :) ).
К чему я все это, да к тому, что сегодня войны между поисковиками
напоминают те же маркетинговые потуги (да пусть не обижаются PR-щики
и рекламщики) с шильдиком New, с ежегодным более свежим запахом
и более сияющей чистотой.
Именно поэтому вместо танцев с бубнами вокруг NEW и пр. необходимо другое качество поиска.

Пример из жизни: долго-долго на рынке персональных компьютеров идут войны за герцы, дюймы, попугаи и т.д. - и вот появляется ноутбук.
Внутри те же герцы, дюймы, попугаи - но удобство и комфорт повысились на порядок. Объёмы продаж ноутов уже сравнялись с персоналками.

Сами пользуетесь?
может быть, может быть (другое качество). С другой стороны, я как-то начинал писать статью - давно уже - но все никак не напишу по поводу сравнения поисковиков с желтыми страницами. Это как приезжаешь в незнакомый город,
и первое время активно набираешь 09 :). Ну а потом потребности в справочной службе постепенно _но_верно_ снижаются. И мне кажется подобный сценарий, вполне возможен и с поисковиками (с учетом роста спец.сервисов, соц.сетей и т.п.). Хотя, сегодня, когда количество интернет-пользователей постоянно растет (по крайней мере, у нас в России), возможно о нем еще рано говорить.

а ноутбуком пользуюсь ;).
Но некоторые ищут не серверы нужной тематикой, а документы с фактами... я могу знать наизусть урлы нескольких десятков нужных мне сайтов, тем не менее, постоянно юзать поисковик для поиска нужных мне фактов прямо на этих сайтах... и никакого нового качества мне не нужно...хотя одно конечно нужно, чтобы поисковик находил НЕ документ, наиболее релевантный запросу, а факт, то есть упорядочивал информацию.
Прикольно что Игорь ругает оптимизаторов и фид-провайдеров. При том что основные деньги как он говорит он зарабатывает оптимизаторством и сдачу в аренду технологии бегуну.
Интересно что я не нашел где он ругает оптимизаторов, хотя это могла быть фигура речи, разумеется.
И он ведь не занимается оптимизацией сайтов по поисковым запросам (оптимизация релевантности объявлений это немного не то), так что снова не знаю, что Вас так тронуло.
Зато он прекрасно понимает сирость и убогость нынешних поисковиков.

И дело даже не в интерфейсе нынешних поисковиков, а в самой идее, концепции и алгоритмах, на которых они работают.
Конечно трудно выразить одной строкой запрос к поисковику, поэтому смею предположить, что поисковики будут развиваться в сторону искуственного интеллекта (его элементы и сейчас используются), а процесс поиска будет напоминать скорее беседу, чем попытку с первого раза сформировать действенное заклинание)) (как еще можно назвать строки с разными символами типа &&, || взятыми из программирования и малопонятными рядовым пользователям, которые вскользь как серфингисты пролетают интернет и не желают даже ознакомится с многостраничными help-ами так заботливо для них приготовленными).
Спасибо Игорю...очень интересно и позновательно...также спасибо всем комментаторам. Очень позновательная дискуссия. =)
Хотя мне лично кажется, что проблема нескоько системнее, чем изменение интерфейса и визуализация выдачи. Проблема в том, что поисковик находит ссылки на релевантную информацию, созданную другими. То есть, он найдет ровно то, что есть...все конкурирующие технологии соревнуются лишь в упорядочивании этой информации. Но если информация избыточна, или нет никакой разницы в 200 источниках одного и того же, сортировка выдачи не создает дополнительной стоимости. Поисковики смогут создать дополнительную стоимость лишь в том случае, если смогут отжать информацию. Пока же никто, кроме высокооплачиваемых аналитиков этого сделать не может, по крайней мере, роботы.
То есть системная проблема в том, что теперь мало просто найти ссылки на то, что есть, это уже как "вода из крана"...теперь нужно структурировать не ссылки, а саму информацию...
Надеюсь, я понятно объяснил...=)
Вы не один так мыслите, но пока новых роботов никто не написал и не выдвинул принципиально новой идеи и тем более не разработал новой концепции.


"Пока же никто, кроме высокооплачиваемых аналитиков этого сделать не может, по крайней мере, роботы." - потому этии люди пока без высокооплачиваемой работы не останутся.
Надеюсь "пока" продлится достаточно долго...=)
Я так недумаю.

Вся эта рубиловка бабла на контекстной рекламе процесс не бесконечный и все это прекрасно понимают и суетливо пытаются найти новую бинес-модель и технологию этого самого рубилова $$$$$$$$

Кто уже не первый день имеет широкополосный доступ в Интернет, уже давно разочарован в нынешних поисковиках.

Но ведь кто-то втихаря наверняка что-то придумал очень интересное и перспективное и главная задача всего этого - вывалить это так на рынок, чтобы не остаться под обломками всего того, что было сделано до этого.
Я, например, не разочарован в поисковиках... поисковики - это инструмент аналитика... и всяким инструментом нужно уметь хорошо пользоваться, но как всякий инструмент (за исключением волшебной палочки) они не делают за тебя твою работу, они лишь облегчают некоторые операции...
А по поводу того, что и что придумал... каждый день люди придумывают кучу идей, проблема только в том, что они до последнего момента не знают насколько их идеи интересны и перспективны.
Нет, то что они интересны, никто из изобретателей не сомневается, а вот в том, что они перспективны... только жизнь покажет...
Тем не менее, надеюсь, что робот, который может писать аналитические отчеты и строить прогнозы даже будучи придуман, не сможет реально создавать ценность... верить в это мне позволяет следующее соображение:
Допустим, будет придуман робот, способный более менее надежно строить прогнозы... но тогда эти роботы будут везде и у всех будет один и тот же прогноз... но тогда, многие люди доверяя этому прогнозу будут действовать совсем по-другому, нежели они действовали иначе... и тогда прогноз не сбудется.
Думаю роботы никогда не смогут СОЗДАВАТЬ информацию, они смогут ее лишь искать, сортировать, отжимать... первые два действия они кое-как делают, а вот второе пока еще не могут. =)
Аналитические прогнозы и соответсвующие выводы роботам пока не под силу.
т.е через лет 20 я в гугле буду искать не "носки ручной вязки шерстяные" а поисковик "вязание"? а чем это лучше?
Тем что вы не будете искать поисковик "вязание". Вы будете искать там, где Вам комфортно и где Вы привыкли обитать в интернете. То есть, если Вы хотите купить носки, то Вы просто заходите на свой любимый товарный каталог, и вводите там "носки". Находите предложения.
Если Вы хотите научиться вязать носки (или шерсть выбрать, что угодно), то Вы заходите на вязальный форум (блог, или что-то типа хабрахабра) где водятся "вязальщики" и там в поисковой форме вводите "носки". Получаете информацию о том, как их вязать.
Если Вы хотите понять, насколько полезно ходить в носках, вы идете на любимый медицинский портал и там уже ищете "носки".

То есть, тематический поиск следует размещать там, где ясно, что собственно пользователь хочет.
Sign up to leave a comment.

Articles