Pull to refresh

Comments 186

UFO just landed and posted this here
Правда?
даже при выходе из аккаунта и переходе в анонимный режим, Google продолжает подстраивать поисковую выдачу согласно ранее собранной о пользователе информации
UFO just landed and posted this here

Пользуйтесь виртуальными машинами. Я правда в последнее время стал скептически посматривать и на "попользовался машиной — откати к нулевой точке восстановления" (там, где чистая операционка) и всё больше засматриваюсь в сторону автоматического создания виртуалок и ещё мне интересно, не придумают ли скоро технологии, когда фингерпринт виртуальной машины будет содержать параметры хост-машины (а что, ведь выход из виртуальной машины уже давно умеют делать, скажем вирусы-трояны)

Пользуйтесь виртуальными машинами

А что насчёт IP адреса (и сопутствующей геолокации по нему)?
Или ещё и прокси к виртуалке привязывать нужно?
Tor.
Правда, Гугл может отобразить страницу на неизвестном языке и обвинить Вас в том, что Вы — робот. o_O
UFO just landed and posted this here
Тогда не обвинить, а поприветствовать
Пользуйтесь ipv6 (например от tunnelbroker.net) — прям идеально сбивает все поисковые пузыри, связанные с местоположениями…
ну, как сбивает… У меня жужль постоянно на шведском всё пишет (подключён через Стокгольм). Да, он думает, что машина в Швеции, но ведь он всё время так думает, а не то чтобы сегодня — Лилль, завтра — Браззавиль.

Пользуюся я как DuckDuckGo так и ipv6.google.com. Выборки — разные. Аккаунта жужль у меня нет, так что даже не логинился никогда.

Не, можно конечно, подключиться через разные сервера (вроде пять серверов на аккакунт дают, да и аккаутов можно несколько завести) и по крону их рандомно переключать на руотере. Но это — вышак.
C геолокацией по IP отдельная проблема. Даже если в настройках поиска указать страну и язык, Гугл все равно подсовывает тебе результаты поиска для твоей страны. Посмотреть выдачу в другой стране, кроме как через прокси / виртуалку невозможно.
При этом наблюдается другой забавный «баг» Гугла — у него свои закрытые алгоритмы геопривязки IP с непонятной логикой. Когда все другие сервисы верно определяют страну (под верно я понимаю, что трафик с сервера физически уходит через маршрутизатор провайдера в какой-то стране (легко проверить c помощью trace ) Гугл решает «по своему». Особенно часто проблемы как раз с виртуалками.
Было бы все так просто, не было бы у гугла проблем с ботами и спамом.
Я триалю Vivaldi, но полностью туда не переехал. Выдача из под хрома и из под вивальди отличается. В вивальди у меня свой акк и в гугл из него не логинюсь. И, что характерно, из убунты в гугл логинюсь на хромиуме, но выдача отличается прям разительно. Такое ощущение, что на логин гугл обращает внимание в последнюю очередь.

Очень жаль, что вам непонятно, как открыть файл с инструкцией (где написано про private window), зато понятно, как написать комментарий на Хабре о ваших непонятках.

яндекс делает так же, а какие ещё варианты, если нужны деньги?
Не рубите, почтенные люди, сплеча...
… Не спешите, друзья, осуждать палача:
Если платят за каждый удар по динару,
Руки сами спешат к рукояти меча!

(Олег Ладыженский)

В силу некоторых причин (не паранои) давно использую приватный режим на всех браузерах и устройствах, и стараюсь не логиниться где-либо без необходимости, тогда после перезапуска браузера персонализация пропадает и почти все сайты покрываются одной и той же рекламой вот уже несколько лет: «Нужна Помощь От Бога?».
Ощущение, что гугл так троллит :)
UFO just landed and posted this here
ежедневная история!
попадается исключительно на сайтах с информацией по программированию,
может Скайнет предупреждает…
Забавно. Вчера тоже вошёл в режим инкогнито в хроме, и первый же сайт выдал мне вот этот баннер. Интересно, с чем это связано…
Баннер с предложением помощи от бога
image

Часто его вижу в хроме на планшете, без инкогнито. Но только на определённых сайтах. Например, на викии по дарк соулс)
Немного СПГС:
«Бог Ответит Тебе.» — БОТ
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
Господь как бы намекает вам: «От Гугла-то вы спрячетесь, а вот от Меня...»
«Вчера тоже вошёл в режим инкогнито в храме...» может так?
UFO just landed and posted this here

Страшно подумать, чем обернётся…
Хотя, это идея для троллинга всяких церковников:


  • А какой бог — более истинный?
    Тот, который в интернете (Гугл выдаёт)
    или тот, картинки с которым здесь у вас?
Я всегда по ней кликаю, так же им бюджет можно слить.
Руками чтоли кликаете? adnauseam же есть.
Спасибо, не знал про такое. Думаю её уже научились определять рекламодатели и клики не засчитывают
Бюджет вы может и сольете, но зато Google будет считать рекламу эффективной и показывать ее чаще. С бюджетом рекламодатель вопрос может решить, а вот если по этой рекламе никто не будет кликать, тогда действительно будут проблемы из-за алгоритмов Google.
Постоянно вылезает, особенно когда ищещь информацию по разным системам.
Причем немало доставляет и продолжение: «начни с ним отношения сейчас». Спасибо хоть не тащат сразу в ЗАГС.
Хотя иногда могут быть и забавные ситуации с подобной рекламой. В частности пару месяцев назад на хабре в какой-то из статей такой рекламный блок, прилегая к чьему-то комменту образовал забавный микродиалог который выглядел примерно так:

— «Пытаешься найти бога?»
— Это всего лишь список констант с адресами регистров.

Да ладно, на телефоне в хроме, используемом для чтения новостей подряд на rbc и interfax-е а так-же habra в основном по дороге на/с работы постоянно висела реклама сайта знакомств надоело ткнул крестик, там варианты "почему", наиболее честным вариантом оказалось " услуга оказана" так после этого стала показываться реклама сайта вида "любовница по расчёту" :)

А откуда вывод что
Google продолжает подстраивать поисковую выдачу согласно ранее собранной о пользователе информации

Для этого нужно показать корреляцию пользователя и информации. В материале есть лишь различие получаемых данных разными пользователями. Этому может быть и иное объяснение.

Вот тоже об этом сразу подумал. Может у них алгоритмы недетерменированные. Или эксперменты всякие случайно включаются.

Статью не читай, комментарии пиши?
Я не понял про анонимный режим. Этот режим был включен где, в браузере Chrome? Тогда я не удивлен. А если использовать Opera, то какие будут результаты? А почему фильтр только по государству? Может гугл подстраивает выдачу под штат, город? Слишком много но. Но то, что они за нами следят, это и так понятно.
В идеальном мире анонимного поиска каждый пользователь, который не захотел предоставлять Google свои персональные данные, должен получать один и тот же набор наиболее релевантных ссылок на свой запрос, как и любой другой пользователь из его страны.

Конечно, нет. Анонимность не имеет никакой связи с вариативностью: Гугль может слегка перемешивать поисковую выдачу для всех пользователей, чтобы потом использовать результаты для улучшения релевантности для всех пользователей.

Ну и со стороны гугла было бы глупо не учитывать местоположение. Очевидно, результаты поиска «зимняя одежда» для жителей Аляски и Флориды или абсолютно разные, или кто-то из них будет крутить пальцем у виска.

О как это бесит когда ты находишься в стране с плохочитаемым для тебя языком (к примеру Греция)

Хм… Запрос «gun control» и «immigration» в фоксе и 2х приватных окнах waterfox дал один результат, а в ишаке — другой, несколько отличный. Без сравнения с тем-же запросом с другой машины — малопоказательно, но любопытно. Возможно, что на поиск как-то влияют настройки конкретной системы. Было бы интересно сделать несколько копий одной системы и посмотреть, как изменится поиск в таком случае.
ЗЫ: гуглаккаунта нет.

Tor при раскрытии на весь экран предупреждает — не надо так делать — это добавляет информации следящим...

Не понял, при чём тут тор и слежение.
С этой точки зрения в моём примере плохо вообще всё, начиная с использования ишака.

БОльшие размеры картинки — бОльшие угловые размеры изображения в окуляре?
Это надо быть параноиком с манией преследования.

Немного проще, это действие даёт доп. информацию о разрешении экрана, хотя сейчас уже не так актуально, из-за стандартизации разрешений.

«Поисковик» Google уже давно перестал искать. Он теперь впаривает, а не ищет. Пока вы ищете нечто распространённое, у вас даже может сохраняться иллюзия, будто Google действительно ищет. Но лишь только захочется странного, отличного от того, что ищет 95% населения…
Вот например, мне потребовалось узнать физические размеры (высоту/диаметр) банки бнв-1000. И что же? Google завалил всю выдачу ссылками на мотоциклы BMW, и пришлось изрядно потрудиться над запросом, чтоб найти искомое.
Или вот если вам нужно найти статьи по настройке VNC, то он забьёт всю выдачу статьями про мобильного оператора МТС.
Или если вы хотите найти статьи по созданию плагинов к Firefox Mobile. Именно Mobile, потому что там всё кардинально отличается от десктопной версии. Но заставить Google выдавать только те странички, где есть слова «Mobile» и «Android» невозможно в принципе, он выдаст вам вообще все статьи про создание Firefox-плагинов, и найти в этой выдаче те, где речь идёт о мобильной версии, не проще, чем иголку в стоге сена. Тут даже поиск по базе знаний Mozilla даст более релевантные результаты.
Вообще, выполнить самый обычный строгий поиск, чтоб в выдаче оказались те и только те страницы, где по Ctrl+F найдётся каждое слово запроса, уже давно невозможно. Теперь Google сам решает, что конкретно вы ищете. И если его мнение отличается от вашего — что ж, вам не повезло. Ну это общая тенденция сейчас, мол сервисы должны не удовлетворять спрос, а создавать его. Но это в любом случе нельзя называть поиском. Это именно впаривание, которое в некоторых случаях лишь создаёт иллюзию поиска.
Уж молчу про откровенный поисковый мусор, когда всякие pinterest'ы и прочий шлак иногда по 5-6 страниц занимают.
Вот например, мне потребовалось узнать физические размеры (высоту/диаметр) банки бнв-1000. И что же? Google завалил всю выдачу ссылками на мотоциклы BMW, и пришлось изрядно потрудиться над запросом, чтоб найти искомое.

Поставить две кавычки — это "изрядно потрудиться"?

Не, вы конечно правы насчет кавычек, но тем не менее факт налицо.

Немного другой пример — меня как-то откровенно утомила попытка гугля сделать автозамену «ms sql» на «my sql». Это не «изрядно потрудиться», если вам нужно один запрос, но так как отключить эту автозамену практически нельзя, и вы регулярно ищете что-то подобное, такое поведение способно просто достать.

Фактически, я бы на сегодня ВСЕ запросы писал бы в кавычках, чтобы всю подобную логику отключить. Назвать это достижением язык не поворачивается.
Чтобы не было автозамены «my sql» на «ms sql», «my sql» следует писать как «mysql».
Вы о чем? Мне не было нужно my sql, мне нужно MS. И самое главное — вся эта хрень чрезвычайно непредсказуемая. Вот на сегодня например такой автозамены уже я не вижу.
Мне не было нужно my sql, мне нужно MS.

Так вам нужен был НЕ me sql, а ms sql, и поэтому вы для предсказуемости искали my sql, а НЕ ms sql?
Чччерт, был невнимателен. Или последующий комментарий сбил…
Вот на сегодня например такой автозамены уже я не вижу.

Ну они развиваются, потихоньку. Искусственные интеллекты, я имею в виду.
как альтернатива в данном случае — искать t-sql (Transact-SQL), что по сути тоже самое, что MS-SQL
Ну вы надеюсь понимаете, что тут вопрос не про обходные пути (кавычки тоже помогают обычно), а про то, что неотключаемые «автозамены» — это зло.
UFO just landed and posted this here
UFO just landed and posted this here
Вот пару лет назад такое и было. Сейчас у гугля другие приколы.
Немного другой пример — меня как-то откровенно утомила попытка гугля сделать автозамену «ms sql» на «my sql».

А я этой автозамены не вижу.

А ее уже пару лет как и нет. В этом-то и гадость, что она непонятно откуда появилась (точнее, это как раз можно предсказать — если у вас большая сеть за одним IP, вполне могут быть казусы, когда в той же сети постоянно ищут что-то другое, а вас поисковик отличить от коллег не в состоянии), непонятно, как ее отключить (кроме заключения всего подряд в кавычки), а потом непонятно куда делась.

Ну то есть проблему починили, но вы все равно недовольны.

А с чего мне быть довольным? Поисковик, задача которого искать что просят, за меня решает. Мне оказывается, было нужно совсем не то, что я просил. Когда это выглядит как подсказка под строкой поиска «возможно вы искали вот это...» — это нормальное поведение. А в форме не отключаемой автоматической замены — это просто ужас. И это поведение никуда не делось, оно на месте. И мусор, которое оно создает — тоже.

Это я еще перевод не вспоминал, когда слова в кавычках автоматически переводятся на другой язык, и ищутся.
Не спасает. Я сейчас не приведу конкретные примеры, но не раз был раздосадован тем, что гугл игнорирует минус и кавычки — в полученных вариантах, популярных среди большинства пользователей, но бесполезных мне, не было нужного слова в кавычках или наоборот было вычеркнутое.
Перестал пользоваться гугловым поиском как раз после того как он проигнорировал минус в запросе.

Это не всегда помогает, в яндексе раньще был отличный способ +словоКотороеДолжноБыть -словоКоторогоНеДолжноБыть но теперь так не работает....

UFO just landed and posted this here
На такой запрос тратится гораздо меньше времени, чем на разгребание всех ссылок про «БМВ».
UFO just landed and posted this here
Так надо именно в кавычках и искать, чтобы гугл искал точное совпадение: "бнв-100" размеры
Я думаю, Гугл даже опечаткой это не посчитал.
Если представить себе, сколько человек набирает «бнв», имея в виду именно BMW… Если у гугла есть какой-то алгоритм, сопоставляющий набранное с кликнутым, то он стопудово сделает именно такой вывод.

Самое удивительное то что Яндекс и без "-bmw" нашёл то что нужно..

Очень интересное наблюдение. Я тоже ощущаю падения качества поиска в гугле, я уже начал многое искать в яндекс. т.к. не могу найти требуемое.
Не поможет :( Это всемирный заговор, и *яндекс тоже в нём участвует (о чём помещал подробный отчёт habr.com/company/yandex/blog/336094 )

Яндекс хотябы пока выводит строку автозамены, в которой можно быстро вернуть запрос на место...

Дело, к сожалению, вовсе не в строке автозамены, а в том, что там считают, что «если вектора (а значит, смыслы запросов) оказываются достаточно близки, то и результаты поиска должны быть схожи». Почитайте по ссылке, которую я привел выше.
UFO just landed and posted this here
UFO just landed and posted this here
Я недавно искал 2 распространённых лазерных принтера Brother. Вводил полное наименование. Гугл их не нашел.
Так это не в гугле дело. Это интернет стал таким. Все везде пытаются тебе что-то продать. Или с чем-нибудь «помочь».
Возможно. Но тем не менее — язык запросов был уже однажды упрощен в угоду непонятно кому, и сегодня вы сложный запрос реально составить не можете. А значит наши возможности фильтровать мусор уменьшились.

Причем такая же фигня была проделана похоже и с картами — т.е. налицо явные попытки заменить поиск данными из «каталога». Оплаченного, ясное дело.
А можно пример запроса который сейчас невозможно составить? Я не спорю, мне реально интересно. Я только поиск по регекспу могу придумать, но я хорошо понимаю почему его нет — это просто невозможно же вычислить даже на гугловых серверах.
Ну регекспов мне кажется никогда и не было. А вот "+слово" в значении «обязательное наличие вот этого слова» ликвидировали, причем уже очень давно, так что «сейчас» — это уже лет пять как, наверное. Кавычки его кстати не заменяют, потому что у них другой смысл.

>просто невозможно же вычислить
Насколько я понимаю, наличие плюса не усложняет вычисления. А отсутствие кавычек (то есть, мы ищем и синонимы) наоборот, как раз усложняет.
Про вычисления я говорил исключительно в контексте регекспов, не вообще. Про +слово и правда интересно, я даже вспомнил что несколько лет назад сам наткнулся на то, что его нет (в гугле) — видимо когда-то еще раньше я им пользовался и смутное воспоминание было.
Я вписал Ваш текст и получил ответ.
И какой же поисковик позволил Вам избавиться от перечисленных проблем?
Нигма жаль померла. Была удобная кластризация ответов.
Да, это бесит. Подозреваю, что инженеры гугла оптимизируют статистику попадания в цель, забив болт на аутлаеров.
Рассмотрим простой пример: есть запрос1 (МТС), который интересен 99% людей, и запрос2 (VNC), который интересен 1%, и есть вероятность, пусть это будет 3%, что человек, искавший запрос1, сделал ошибку, и написал его, как запрос2 (забыл сменить раскладку).
Простое правило типа
if(query == 'VNC') {
query = 'МТС'
}
в ядре гугла сразу повышает статистику попадания для запроса VNC с 25% до 75%. Все очевидно.
А в реале перекос может быть и 99.999%/0.001%, и понятно, под что обучатся самообучаемые алгоритмы. Так что да, такая вот диктатура большинства выходит. Хорошо, что есть лайвхаки типа запросов с кавычками, или стоп-слов. Но я не буду удивлен, если завтра и они исчезнут, ведь продакты гугла решат, что поддерживать фичу, которой пользуется меньшинство, ценой усложнения реализации хранилищ и ядра, глупо.
Хорошо, что есть лайвхаки типа запросов с кавычками, или стоп-слов

Это не лайфхаки ни разу. Это описано и в инструкциях, и можно настроить в расширенном поиске.
К которому доступ сильно усложнили по сравнению со старыми временами — когда нажимаешь кнопку и попадаешь сразу в расширеный поиск.

Попробуй просто нагуглить документацию и статьи по новому Angular, который не AngularJS. Видимо, боль и страдания — неотъемлемая часть философии этого фреймворка.

Это тоже заимствование у предшественников. *Ушёл дальше гуглить про С без плюсов"
Обычно помогает называть его «clang», а в случае JS, например, plain JS или vanilla JS еще его называют.

А так, добавление контекста обычно сильно помогает гуглу сориентироваться, например, дописать document.querySelector – и вариантов, использующий jQuery, в результатах не будет. К тому же, оно помогает ему еще и искать точнее.
Angular docs -«AngularJS» должно помочь

Спасибо. Очень user-, а главное SEO-friendly to подход.

Но лишь только захочется странного, отличного от того, что ищет 95% населения…

Так это всегда так было. Лет 8 назад захотел я завести аквариум. Гугло-яндексы показывали только сделанные на коленке сайты визитки с 1-2 статьями про заведение аквариума и все. Огромный русский форум про аквариумы, на котором есть абсолютно все от статей про гуппи, до тропических жаб, нашел только спросив напрямую у когото в комментах.
Прошло несколько лет, решил я занятся настольным Вархаммером. Ситуация повторилась — вся выдача в коленочных магазинах на вордпрессе, а огромный русский форум с тоннами текста по делу удалось найти только спрашивая у людей в комментариях.
Когда-то давно была у части форумов мода на noindex, уж не знаю, зачем.
У маленьких сайтиков может быть, но эти оба форума владельцам явно чтото приносят, потому что рекламы там дофига. Уж наверняка они заинтересованы в том, чтобы гугл к ним народ приводил.
Я, к сожалению, не очень компетентен в заинтересованности владельцев форумов. Просто помню, что мода такая была, и если форум этой моде следовал, найти его гуглом было не очень реально.
Полагаю, из-за создаваемой поисковыми ботами нагрузки на сервер и не любящих эту самую нагрузку хостеров.
UFO just landed and posted this here
Нет, я имел в виду, на страницы самого форума. Они не искались так же, как сейчас вы исходный либрусек гуглом не найдете. Упоминаний сколько угодно, прямой ссылки нет.
Это ещё что, 15 лет назад была проблема найти про аквариум, который не группа 'Аквариум'.
Два момента в этом исследование не учтены
1) Геозависимые и геоНЕзависимые запросы
yandex.ru/company/technologies/regions

2) Результаты сравнивались из разных дата центров.
Похоже, скоро уважающие себя браузеры (кроме хрома, яндекса и как-там-нынче-зовут-амигу) будут выполнять запросы к поисковикам из «рандомно зашумленных» песочниц… )))
UFO just landed and posted this here
UFO just landed and posted this here
Не знаю архитектуры гугла, но подозреваю, что если исходить только из вычислительной сложности, то дешевле все же запросы «выравнивать». Вряд ли имеет смысл на каждом шарде пересчитывать запрос заново, когда можно его закешировать хотябы на уровне страны, и отдать за О(1).
Скорее что-то типа А/Б тестов, или генетических алгоритмов, оптимизирующих выдачу.
Вряд ли имеет смысл на каждом шарде пересчитывать запрос заново, когда можно его закешировать хотябы на уровне страны, и отдать за О(1).
О! Отличный вопрос для собеседования. Любому программисту, который подумает над вашей идей несколько минуть должно стать понятно почему она не просто плоха, но катастрофически плоха. То есть: она не просто не принесёт ускорения, но ухудшит результаты.

Подсказка: дать ответ на запрос из одного слова — проще, чем на запрос из 10 слов.

Скорее что-то типа А/Б тестов, или генетических алгоритмов, оптимизирующих выдачу.
Да, это ещё одна причина.
Безотносительно отпечатка конкретного пользователя — меня как-то позабавило, что в анонимном режиме мне хром подсказывал при поиске запросы, которая делала дочка из этой же сети.
Ну он анонимный, да, то есть не привязан к истории использования на этом устройстве. Но никто не обещал отключать аналитику по месту расположения, по подсети, по времени суток…
Хотите полной анонимности — заходите из-под виртуальной машины на удалённый сервер, там запускайте другую виртуалку, подключайтесь к vpn — и вперёд!

Это только в первый раз. А начиная со второго запроса у вас будет свой поисковой пузырь, привязанный уже к серверу VPN и виртуалке.

«Самое надёжное противозачаточное — надеть три презерватива, промазать зелёнкой, обмотать синей изолентой, и главное, никакого секса!»
Так это норма, анонимный режим (теоретически) запрещает сохранять сессионные данные, но позволяет загружать основной профиль. Изоляция односторонняя.
Зато «порно с мёдом» оно научилось искать… Видимо всё же кто-то из гугл читает мои комменты на хабре…
Делать одинаковые запросы в одно и то же время из одной страны может быть мало для такого эксперимента. Гугл может выдавать разные результаты анонимным пользователям разных ОС, разных Браузеров, разных версий всего этого добра итд итп.
Интернет в лице крупных ИТ корпораций, решает что мы должны знать. Ну ладно, этим грешат все СМИ и правительства. Но сейчас это выходит на новый уровень, знать про каждого отдельно, накапливать столько статистики, что управляет отдельными людьми, создавая сферу искаженного восприятия для каждого отдельно. Через некоторое время это становится для человека нормальным и он считает что мир именно таков. Усиливая выдачу А, а про Б выдавая только критику(и только тем кто знает про существование Б, для незнающих ничего не выдавать), можно добиться того что мнение Б становится порицаемым.

Дык наверняка Google Chrome пользовались (ещё и отправка анонимных данных наверное включена), очевидно ж там свой сквозной идентификатор. Ещё не надо удивляться похожим артефактам, связанным с ОС Android

А меня бесит реализация рекламы у них. Я вот хотел купить тележку для трактора-газонокосилки. Поискал в Гугл предложения, нашёл самую подходящую и страдая муками выбора, купил. Оказалась хрень, ржаветь начала видимо еще на заводе, но возвращать геморрой — поэтому пользуюсь. Но теперь на любом сайте, где реклама не заблокирована мне предлагают разные прицепы для трактора, каждый раз заставляя вспоминать какую дрянную телегу я купил. Я уж и так и эдак пытался убрать из рекламы такую выдачу, но все равно Гугл считает, что тележку я купил плохую и надо купить получше., Теперь для себя решил что весь выбор товара надо делать как минимум в приватном режиме, т.к. пользы от их контекстной рекламы для себя не увидел ни разу, а раздражает она знатно.

Настройте рекламный профиль свой. Это делается за 5 минут
Гугл считает, что тележку я купил плохую и надо купить получше

Разве он не прав?
конечно не прав. потому что мог предложить сразу хорошую, но здесь прям чувствуется финансовый интерес…

Прав-то он прав, но зачем специально давать досаду? :)

UFO just landed and posted this here
Анонимность и приватность — разные вещи. Инкогнито режим в хроме это условно про то, чтобы ваша жена не увидела сайты, по которым вы ходили вчера ночью. Он совершенно не о том, чтобы Гугл не знал, чем вы интересуетесь.

Вместо инкогнито режима можете запускать браузер с чистым профилем. Тогда это будет больше похоже на правду. Но все равно останется ряд моментов, которые вас помогут выдать. Например, особенный набор файлов на жестком диске со специфическим временем последнего изменения.

Вы можете конечно отключить отправку аналитики, если укажете все нужные настройки около 30 штук. Желательно в момент создания нового профиля. Вот selenium с этим неплохо справляется. Или будете с нуля поднимать виртуалки. А лучше и то и другое вместе. Однако часть функциональности в современных сборках хрома не отключается. Например антивирусная защита под виндой.
Эти люди сначала вводили заранее оговоренные и общие для всех запросы в анонимном режиме, который по идее должен обеспечивать выборку, свободную от влияния внешних факторов типа истории поиска, а после — из под своих учетных записей. Поиск производился всеми добровольцами одновременно (эксперимент проводился 24 июня 2018 года в 21:00), сначала в приватном режиме без логина, а после — из под своих учетных записей.

И все это с того же IP, а не через какую-нибудь тор-прокладку. Исследователям пять за смекалку.
Исследователям пять за смекалку

Так иследователи же поисковика главная фича независимые от профиля поисковые запросы. Все логично сделали.
Так иследователи же поисковика главная фича независимые от профиля поисковые запросы
Простите? Не распарсил.
Я давно понял, что гугл мной не интересуется вплане результата для рекламодателя. Он мне даже жалобы на рекламу в gmail интерфейсе запретил (можно по крестику кликнуть, но не пожаловаться по любым причинам), а в ютубе в выдаче благодарит за отказы по предлагаемым видео, принимает объяснения, и тут же возвращает булшит о провальном, попсовые каналы и прочую хрень. При этом я просматриваю специфические IT видео и редка что-то от Далай-ламы и других мастеров. Трафик то Тинькоффа, других кредиторов и Провального нужно сливать.

А ещё в андроиде в играх вечно продаются женские трусы с юлы и попытки как-то повлиять на выдачу бесполезны. Гугл соглашается и через несколько показов подобных игрушек и машин премиум класса (я целевая аудитория?) опять предлагает женское бельё.

Яндекс не лучше. То что в яндекс почте крутит продажу шин не один год (у меня нет машины и ничего такого с моего компа не искалось) и предлагает купить компьютерную мышь, хотя оценки нескольких манипуляторов я искал на маркете год назад и всё давно купил.

Нужно сливать бюджеты. Вот и всё.
Интересно, стал бы кто-нибудь пользоваться платным поиском без рекламы, с точным синтаксисом типа сфинкса, с дополнительными фильтрами и произвольной сортировкой?
С удовольствием! Особенно вместе с Siri/Алисой, которые бы хостились на моем собственном сервере…
Судя по опросу, мое отношение к качеству поиска Я против качества выдачи Гугла (про остальных не говорю) совпадает с мнением аудитории. Очень обидно на эту тему, что, качая Firefox на русском, я автоматом получае себе Я в качестве главного провайдера поиска (у FF я использую оба поля, одно для URL, другое для поиска — так вот если в «поисковом» задать гугл движком, то в «URL-овом» за поиск все равно Я будет отвечать, пока не отучишь (ставил, правда, некоторое время назад, может, сейчас что поменялось, но осадочек...).

Так вот не пойму, зачем такого качества поиск насильственно впихивать (понятно, что бабки, но все же).

И второй вопрос — зачем делать телефоны и прочее, когда даже с поиском поле непаханное для улучшений?
Ответ на первый вопрос: «Кто платит тот и заказывает музыку»
Ответ на второй: Это разные подразделения
Как-то поздно спохватились. В 2018 мы уже знаем, что анальные зонды — благо, это защищает нас от педофилотеррористов и нормальному человеку скрывать нечего. И как-то странно обвинять компанию, чей хлеб — реклама и точный таргетинг(а если ты фейсбук, то тупо продажа всего направо и налево)
Поэтому нет значения вышел ты или нет, у гугла куча возможностей продолжать трекать тебя через ту же аналитеку, кнопки, «партнеров»(банки/мобильные операторы/провайдеры торгуют данными и гугл с удовольствием платит), а андройд сдаст все остальное. Имея такую кучу данных, ценнейшую поведенческую инфу и диплернинг, уже можно деанонить с магической точностью.
Поздно. Теперь ты можешь выбрать только логотип на зонде.
Не знаю чего так все переживают. Мне кажется это даже хорошо, что тебе дают то, что ты хочешь видеть, в нашем современном мире информации, социальных сетей, по моему бессмысленно как-то скрываться, да и зачем? Если ты не нарушаешь закон, то это тебе и не надо.
Эти поисковики уже достали со своим любопытством. По поисковым запросам можно определить портрет личность человека, что он собой представляет, о чем он думает, что его интересует. Но для полной картины этого мало — нужно еще узнать все личные данные. Поэтому они требуют телефоны, скриншоты паспорта, адреса, место и адрес работы, рабочий телефон… Если они все это соединят, то у них будет полное досье на каждого человека. И они найдут применение этому.

Так же о людях много знают браузеры. Заметьте, что они все почему-то бесплатны. За другие программы надо платить, а браузеры навязывают бесплатно. Значит кто-то платит разработчикам за собранную информацию.
Об этом просто не принято говорить потому что давит «окно овертона», но google вас не просто держит в пузыре. Всё куда страшнее. Большинство пользователей, запрашивая что-либо у гугла вообще не подключаются к его базам, а ищут только в пределах Google Global Cache.

Когда приходит осознание столь очевидной вещи, то становится понятной невозможность найти искомое. Особенно это заметно, если вы используете google dorks.

Я провёл несколько экспериментов в течение длительного времени и могу утверждать, что 9 из 10 пользователей вообще никогда не получают ответов от google. Они работают только с содержимым текущего кэша GGC. От этого и становится заметен «пузырь». Более того есть периоды когда кэш «замораживают». Я рисовал график таких «заморозок» поиска. Он всегда совпадает с громкими политическими событиями и крупными рекламными компаниями.

Google всегда был империей зла, удачно позиционируя себя на рынке — мы же помним, кто первый кричит «держит вора».
9 из 10 пользователей вообще никогда не получают ответов от google. Они работают только с содержимым текущего кэша GGC.

А GGC, откуда информацию, по вашему, берет? Вы, вообще, знаете, что такое "cache" в названии Google Global Cache? Зачем он вообще нужен?


Я рисовал график таких «заморозок» поиска. Он всегда совпадает с громкими политическими событиями и крупными рекламными компаниями.

Все абсолютно логично: громкое событие => всплеск популярности у запроса => попадание в кэш.


Вы по любому популярному запросу будете ответ от GGC получать. Он именно для этого и создан — отвечать известными ответами на популярные запросы, чтобы разгрузить датацентры.

UFO just landed and posted this here

Да, был у меня однажды случай: Введя мною выдуманное имя в Гугле ничего не нашлось. "Уникат!" — подумал я.
Спустя некоторое время, по этому же запросу, было пара страниц с результатами поиска. Неудивительно в общем, но насчет "заморозок" неплохо бы было приложить ссылку, чтобы почитать.

Чисто формально, пока не держит. Альтернативные поисковики никуда не делись. Например, на телефоне, где от меня идёт большинство приватных запросов (медицина, быт и т.д.) идут не к гуглу.

А вот к гуглу идут всякие профессиональные вопросы, типа «kapacitor testing framework» и т.д.
Из за их алгоритмов перестал пользоваться Google Play Music и почти перестал пользоваться YouTube. Стоит ребенку зайти посмотреть мультик, так вся моя подборка — это мультики.
Похоже скоро перестану пользоваться и поиском, т.к. все чаще не могу найти нужную информацию по рабочим вопросам. DuckDuckGo на некоторых запросах показывает себя лучше, а житейские типа «кошачий корм» — Yandex
Стоит ребенку зайти посмотреть мультик, так вся моя подборка — это мультики.

Можно открывать ребенку в режиме икогнито или иметь специальный профиль браузера/второй ютуб аккант. Надо только не забыть переключиться перед включением мультиков.


Google Play Music

Там можно 50000 своих песен загрузить и слушать везде без всяких подписок. Я всю свою коллекцию загрузил и горя не знаю.

Уникальность результатов и предвзятость — совершенно разные вещи.


В поиске одновременно(!) идёт большое число (сотни) экспериментов (A/B тестирование). Каждый (!) пользователь участвует в нескольких сразу. Набор экспериментов для каждого уникален, с хорошей точностью. Поэтому да, результаты уникальны.


Эксперименты пользователю назначаются случайно, на основе hash(ID), который присваивается даже анонимному пользователю при первом обращении. Но случайное исправление выдачи ≠ предвзятость.

В поиске одновременно(!) идёт большое число (сотни) экспериментов (A/B тестирование).

У вас есть какие-то подтверждения, что это количество большое?
Сегодня нет. Но пять лет назад мои знакомые, занимавшиеся поиском, говорили о том, что у них почти исчезла «контрольная группа» (== люди, не участвующие в экспериментах), пришлось даже специально менять код сервера чтобы несколько процентов пользователей гарантированно попадали на «чистый» поиск.

После известных событий они больше поиском не занимаются, но я сомневаюсь, что с тех пор стало меньше экспериментов.
Купил паяльник.
На следующий день все магазины предлагают мне паяльники.
Где логика. Я уже купил, нафиг мне ещё 1000 паяльников.

P.S. Для «терморектального криптоанализа» достаточно одного, он омногоразовый. Или они должны быть стерильными? И каждому пациенту обязательно нужен свой.: О
каждому пациенту обязательно нужен свой

Разумеется, вы же не хотите чтобы ваши «пациенты» подхватили какую нибудь заразу?
При достаточно высокой температуре заразы не будет
> Где логика. Я уже купил, нафиг мне ещё 1000 паяльников.

Ну так гугл же не знает, что вы уже купили.
У меня есть подозрения, что если следовать до сайта магазина (и покупать онлайн) через выдачу гугл шоппинг, то гугл засчитает покупку.
Фиг то там. Покупал в октябре Хаккапелиту. Купил, в интернет магазине, подтверждение о покупке, квитанция об оплате и последоставочное «спасибозапокупкубудемрадыеще» лежат в почтовом ящике gmail. Воу-воу, у гугла есть к нему доступ, он затем и делал этот «бесплатный» gmail, но вот уже декабрь, а мне всё ещё показывают рекламу шин.
На всякий случай: Гугл умеет трэкать даже офлайн-шопинг: в админке для рекламодателя есть функция оплаты за рекламу, только если пользователь пришел и купил. Об этом на хабре летом была статья, правда, не нашел ссылку. Ключевые слова: гугл, признал, мастеркард.
Если вы паяльник искали через гуглояндекс то оно понятно. А вот кто бы мне объяснил, каким путем мои запросы в каталоге интернет-магазина «Чип и дип» потом сказываются на яндексовской рекламе? Поиск у них там испокон века свой, проприетарный, браузер Фокс не связан ни с Гуглом, ни с Яндексом. В договор между магазином и Яндексом я не верю, в силу довольно таки специфического контингента покупателей, но это единственное, что приходит в голову.
Все намного проще, без договоров и юридических заморочек.

<script type="text/javascript" async="" src="https://mc.yandex.ru/metrika/watch.js"></script>

Эта строчка в коде магазина вам ничего не говорит.
А, блин, точнаа! У меня ведь на моем сайте такая же хрень стоит.
Утверждать что
При таких условиях ожидалось, что все пользователи +\- получат схожую поисковую выдачу, так как запросы производились примерно в одно и тоже время, из одной страны и в определенном порядке.

означает расписаться в том, что ты не понимаешь в принципе как работают современные поисковые алгоритмы.

И речь тут совсем не в том, что Google или любой другой пытается использовать Вашу историю поиска или ваш профайл. А в том, что любой поисковый алгоритм должен понять что лучше. И понять это он может не только на основании оценочных факторов своих алгоритмов, а и на основании того как посетитель прореагирует на тот или иной проект. Сейчас это называют поведенческие факторы. И понять это можно только показав тот или этот проект посетителю. Потому совершенно логично, что выдача все время разная, потому как поисковая машина экспериментирует с выдачей показывая посетителю выдачу с разной степенью релевантности запросу, чтобы уточнить для себя этот запрос.

Предполагать, что выдача всегда для всех и для каждого каждый раз должна быть одинаковой, это остаться в 90тых годах, когда о таком поиске только размышляли.

UFO just landed and posted this here
Лет 7 назад искать информацию было намного проще.

Рост количества информации вы учитываете?

UFO just landed and posted this here

… и это добавляет отдельную проблему выявления дублей, ага.

Тут говорили про fingerprint. Ну не знаю, вот погуглил (check browser fingerprint online) какие-нить онлайн сервисы для тестов. Нашел такой.
Yes! (You can be tracked!)
41.86 % of observed browsers are Firefox, as yours.
0.93 % of observed browsers are Firefox 63.0, as yours.
56.56 % of observed browsers run Windows, as yours.
26.45 % of observed browsers run Windows 7, as yours.
3.16 % of observed browsers have set «ru»as their primary language, as yours.
20.25 % of observed browsers have UTC+2 as their timezone, as yours.
However, your full fingerprint is unique among the 907907 collected so far. Want to know why?

чет как-то не тянет на уникальность. Ещё есть какой-то panopticlick.eff.org. Первые 3 теста yes, 4й no, последний «Does your browser protect from fingerprinting?» вообще не выполнился ибо FF + uBlock + Ghostery + Decentraleyes. И да, ещё у меня стоит удаление куков при закрытии браузера.

Так что я склонен считать отпечаток слишком переоценённым. Если не стоят адблокеры, то вас 110% идентифицируют через адкуки, а если они блокированы — слишком мало параметров, за которые можно зацепится. Особенно если dynamic IP.

PS. Ок, нашел ещё некий HTML5 Canvas Fingerprinting. Однако же в комментах там пишут что не такой уж он уникальный, да и CanvasBlocker есть…
UFO just landed and posted this here

Зря мучались, одного Ghostery вполне достаточно для фингерпринтинга.

чет как-то не тянет на уникальность

Почему не тянет?
«However, your full fingerprint is unique among the 907907 collected so far.» — полный профиль вашей системы уникален среди миллиона уже собраных профилей.

Есть разные способы. Часть из них доступна лишь разработчикам браузеров, часть их партнерам, часть владельцам инфраструктуры. Хром и лиса при установке создают ряд уникальных id, которые регулярно отправляются вместе с данными мониторинга. Есть мутный drm, для поддержки которого браузеры скачивают бинарный код со аффилированных ресурсов. На уровне SSL и TLS есть свой аналог кук, используемый для ускорения процесса создания соединений, но который можно использовать и для других целей. Все для вашего удобства.

Интересно. А что за «ряд уникальных id» (фф интересует) и как он может их куда-то «регулярно отправлять вместе с данными мониторинга» если телеметрия отключена? Да и куда, на посещаемый сайт? Про «На уровне SSL и TLS есть свой аналог кук» можно где-то почитать в разрезе именно деанонимизации?
> если телеметрия отключена

Телеметрия это лишь часть. Рекомендую загнать процесс в sandbox и вдумчиво помониторить сетевую активность. По поводу второго — начните с session id.

Ublock тоже детектится и его наличие/отсутствие это ещё одна "метрика", всё зависит от желания, в принципе тут борьба меча и щита, разрабы ff пытаются снизить возможность слежения сторонними сервисами/разраьы следилок пробить защиту. В итоге на некоторых особо жаждущих сайтах у нас либо всё тормозит (fb) либо докажите что не бот и т.п. (так как даже производительеость в js пытаются использовать) :)
Но браузеры плка (на мой взгляд) побеждают в случае пользователей с похожим на ваше поведением, но при этом проигрывают в массе (и кстати если у вашего провайдера вы такой 1 то со временем и на вас портет будет для всех ip провайдера :))

Убедили, ну допустим, будут меня как-то выделять. А смысл? Рекламы то я не вижу.
Куча недовольства гуглом в комментариях, но я не понимаю, зачем пользоваться поисковиком который вас не устраивает?
Если рассматривать поисковую выдачу и избавление от «пузырей», то есть варианты типа duckduckgo. Даже есть всякие startpage.com, которые работают как прокси, выдают точную копию выдачи гугла на поисковые запросы, только без учета таргетирования и слежения. Почему бы не использовать альтернативы?

Всё что надо знать о "бесплатных" сервисах в интернете: "если вы не платите за товар, значит вы и есть товар".

Sign up to leave a comment.