Pull to refresh

Comments 46

Гораздо проще и быстрее было бы гуглу или яндексу сделать простую штуку — 100$/год и никакой рекламы или подсовывания нужных для рекламы статей. нахрена мне инфомация на запрос learning opengl обновившаяся в 2010 году последний раз когда все устарело. а нет — подсунут потому что там реклама нормально продается…

А на создание такого ресурса нужна команда и $NN MUSD + плюс дальнейшие пожертвования как в википедии. соберем на кикстартере? :) для начала хотя бы команду собрать…

Кстати википедия хотела сделать поисковик (он бы завершил карьеру монстра гугла за год-два) но гугл чистой угрозой выкинуть вики из ранжирования заставил их отказаться от планов. а какой был бы проект! кто там называл гугл корпорацией добра? :)
Кстати википедия хотела сделать поисковик (он бы завершил карьеру монстра гугла за год-два) но гугл чистой угрозой выкинуть вики из ранжирования заставил их отказаться от планов. а какой был бы проект! кто там называл гугл корпорацией добра? :)


Пруф?
но гугл чистой угрозой выкинуть вики из ранжирования заставил их отказаться от планов.

Пруф?)
Вас запутали непрофессиональные писатели новостей. Делала свою поисковую систему не Википедия, а Викия; про это были посты на Хабрахабре в том числе (Поиск по Wikia Search). Хоть у них и общий основатель, но они довольно разные организации, в частности, Викия пытается монетизировать всё и вся в отличие от некоммерческой Википедии, цель развития содержимого у Викии отодвинута чуть ли не на последний план.
Хм, сейчас у Google и Wikipedia явное сотрудничество я так понимаю достигнутое обоюдным согласием, увидеть это можно набрав в поиске Google что-то вроде habrahabr это и отдельная выдача поверх сайтов будет отображать именно краткую вырезку из Википедии (со ссылкой на конкретную статью). Да и вообще с трудом верится, что Wikipedia могла обскакать такого гиганта в поиске… по-сути дела, Google ассоциируется с «поиск», а Wikipedia — «энциклопедия» (причем качество многих статей на ней под вопросом =) ) и резко (1-2 года — это резко, для таких гигантов) поменять эти ассоциации ну лично мне кажется труднодостижимым…

А Вы тут какие-то страшилки рассказываете =)
Согласен с автором. Например: напишешь что-то в поисковике, а потом это что-то тебе начнут на всех банерах рекламировать. Достало, однако.
Хорошо бы еще придумать, как в эту систему войдет существующий интернет. Ну, скажем, вебмастер, который хочет занести в эту систему сайт компании «Яблоко», на который и без этой системы в день приходят миллионы людей. Каковы его действия? В принципе, из гипотетического магазина приложений этой компании уже сейчас есть море ссылок на какие-то «релевантные» сайты, и система поиска тоже есть. Вот только степень релевантности определяется как? Тем, что эти сайты делают что-то для «Яблока». Или тем, что эти сайты продают, например, мобильные телефоны, всякие разные, корейские, например.
Вопрос к тем, кто минусует: вы считаете, что такой проблемы нет вообще, или я такой глупый и не вижу очевидного решения? Отпишитесь пожалуйста, очень интересно.
Сейчас все по другому. Интернет стал давно безлимитным и дешевым.

Только не в Беларуси!
UFO landed and left these words here
Вы ошибаетесь. От того же МГТС Интернет в два раза дешевле. И ведь это не самая низкая стоимость!
UFO landed and left these words here
Всё что сделано кому либо принадлежит.
Релевантная одноранговая децентрализованная пиринговая структура с приоретизированными тематическими узлами
будет кем-то спроектирована и будет служить определённым целям.
Кто может гаррантировать что сайт не будет переводить на «неправильные» узлы? Кто определит понятие и метрики объективной релевантности?
Можно добавить к определению, что система должна быть «саморегулируемой», а объективность должна обеспечиваться статистическими оценочными выборками.
Идея автора меня впечатлила. Неплохо было бы!
Спасибо за оценку идеи. Думаю рано или поздно необходимость реализации такой идеи будет жизненно необходима
Думаю (хотя не уверен), что скорее рано.
Пиринговый поисковик — в этом что-то есть.
Файлообменные пиринговые сети есть, скайп по этому принципу работает, а вот поисковой пиринговой системы кажется и нету…
У aMule (eMule) есть же поиск. Идея не новая.
В моей Пандоре аналогичный планируется, но с возможностью здавать типы записей, по которым поиск осуществляется: человек, компания, товар, проект, статья, объявление, вакансия и т.д.
Как мы узнаем о новом поисковике, если Гугл исключит его из результатов поиска? :)
А как мы узнали о Пиратской бухте?
Из уст в уста, сарафанное радио, социальные сети, другие сайты, которые будут писать о системе и не будут исключены Гуглом. Возможно нужен будет даже специальный браузер для навигации по новой сети… Можно будет начать шпионскими методами, предложив и Гуглу какое-то время поучаствовать в качестве узла.
И хотя и говорят, что Вики это не совсем поисковик, с чем я согласен, но это прецедент, что в принципе некоммерческая организация может управлять огромным потоком данных и поддерживать мощные сервера.
Думаю, что собрать на поисковик пожертвований можно будет без проблем — Пусть к примеру 300 миллионов человек, а для примера, именно столько перешло с Reader на Feedly в течении месяца, сбросятся по 10 у.е. — это будет 3 миллиарда — вполне себе нормальная сумма для стартапа!
В книге хорошо написано, как влияет выдача на мировоззрение.
И более того, как мировоззрение влияет на выдачу.
Пишет о том, что в штатах выдача для республиканцев и демократов разная.
Т.е. где-то упомянул человек на форуме или в соцсети, что он демократ — а гугл ему раз и уже другую выдачу.
Ну правильно, это и есть узурпация влияния на наше сознание…
Угу, демократы думают что в стране все хорошо, демократы победили. Республиканцы думают что победили они, тоже работают себе спокойно, подтрунивают над демократами. Все счастливы, а Гугл… а Гугл рулит.
Нужна согласованная формула ранжирования, которая бы всех устраивала.
Нет. Для распределенного поиска это не обязательно. Более того, в случае децентрализации поиска — невозможность «диктовать другим свое ранжирование» и есть главная «фишка».
Я думаю система типа Alexa Internet и социальный поиск могут снять часть проблемы.
Дополню, что я ни разу не специалист, но разделяю озабоченность автора. И поэтому тоже думал над проблемой.
Вы правы, очень похоже по идее, но там есть проблема: " В сеть может войти каждый пользователь, установивший программное обеспечение под GNU/Linux, Windows или MacOS", а это сразу отбивает желающих участвовать, а тем более затруднительно для самых обычных пользователей. Как сделать по другому? Пока не знаю…
Форкнуть, переписать на JS и сделать надстройкой к браузеру
Я так и не понял, как вы собираетесь решить проблему "Учительницы" и неприведигоспаде "мокройкиски"?
К слову Гугл очень серьёзно подходит к этой проблеме, и использует 3 степени поисковой фильтрации.

Пока что это единственная проблема которую вы назвали. И никакого решения, к слову, не предложили. А это
Главный же недостаток поисковых систем с позиций интернет-сообщества в том, что они кому-то принадлежат.
Не недостаток, а банальная паранойя.
Пока что это единственная проблема которую вы назвали

Если не считать навязывание поисковыми системами своих алгоритмов ранжирования сайтов и их претензий на абсолютную истину.
как вы собираетесь решить проблему «Учительницы»

Например, с помощью учета оценочного мнения сообщества, использующего систему (саморегулирование)
Если не считать навязывание поисковыми системами своих алгоритмов

А вы предлагаете навязать новый алгоритм. С претензией если не на абсолютную истину, то на большую релевантность чем у существующих поисковых движков.

Например, с помощью учета оценочного мнения сообщества, использующего систему (саморегулирование)

Гугл уже сейчас использует систему жалоб влияющих на алгоритм фильтрации. А его алгоритмы основанные на машинном зрении, распознавании образов и ИИ, показывают неплохие результаты. Даже для таких сложных случаев как учительница или мокрая киска

В статье я не увидел ответа на вопрос — чем ваш алгоритм лучше существующих? Чем он хуже можно в рассчёт не брать.
чем ваш алгоритм лучше существующих?

На самом деле алгоритм как бы и не излагался, была попытка актуализировать проблему и услышать мнения.
«Обратите внимание, что платные ссылки на сайт рекламодателя в системах платы за клик не передают PageRank и не нарушают наши рекомендации.»

А что вы думаете по поводу приведенной цитатки из гугловского руководства?
Вообще проблема актуальна и понятна, но у меня подобные рассуждения всё время вызывают очень противоречивые чувства. Вроде бы вот он, интернет, любая информация на кончиках пальцев, не по одному запросу, так по другому. Но всё равно находятся люди, которые считают, что человечество обязательно надо осчастливить тем, чтобы «объективная» и «наилучшая» информация не просто предоставлялась, но и разжёвывалась и проглатывалась за ищущего.

Это напоминает некоторых наших политиков, которые считают, что под «свободой слова» подразумевается не просто возможность свободно излагать свои мысли в личном журнальчике или газете, но и обязательный допуск на первый канал, причём в прайм-тайм.

Ну как бы неплохо, чтобы действительно выдача была адекватной и репрезентативной, но на всех всё равно прайм-таймов и первых каналов не напасёшься. Да, по запросу "<название игры> скачать бесплатно" Гугл, как правило, не выдаёт в самом верху страниц, где искомую игру и вправду можно скачать бесплатно.

Мне кажется, что быть или не быть «в пузыре» — личное дело каждого, хотя для общества, по всей вероятности, было бы лучше иметь поменьше таких пузырей. Но тянуть кого-то насильно в честный новый мир — это уже перебор. Ну совсем уже обленились. Сначала программу проинсталлировать лень, потом вбить название сайта лень, потом составить поисковый запрос лень… ну чёрт побери, да не хочу я тратить своё время на облегчение жизни вот таким «ленивцам», должна быть где-то грань разумного! Лет двадцать назад на трамвае до библиотеки было доехать не лень, а теперь, видите ли, пара лишних щелчков мыши проблема.
Должен быть создан алгоритм построения такой структуры и никто не имеет права влиять на его работу.

Как вариант — на едином индексе каждый, кто ищет, может использовать свой алгоритм. Взамен в фоновом режиме лазает по сети, индексирует страницы, обрабатывает запросы.
Only those users with full accounts are able to leave comments. Log in, please.