Как стать автором
Обновить

Комментарии 74

Нескучная точно! :)
Хм, а у меня 403я ошибка…
+1
Скопируйте ссылку, там стоит какая-то фильтрация по заголовку Referer. Долго мучался с настройками прокси в nginx, пока не понял что дело в этом.
Мне обновление помогло :) Не знал про такую «ленту», спасибо!
CAPTCHA — это разновидность обратного теста Тьюринга.
НЛО прилетело и опубликовало эту надпись здесь
Попозже вечером и не такое будет…
<item found="75253">хенд хантер</item>
<item found="811420">"крутит" левую руку</item>
<item found="66841">вконе</item>
Помнится, лет 5+ назад проскакивало видео, где под музыку-рубилово в течение 5 минут показывался нефильтрованный прямой эфир Яндекса. Просмотр оставлял очень тяжелое чувство боли и обиды за окружающее общество.
НЛО прилетело и опубликовало эту надпись здесь
Гости страны они такие.
<item found="60">пельменемет</item>

Оказывается и такое есть…
Смысл в обезличивании таких запросов, если по их содержимому можно и так получить: адреса, email, телефоны и многое другое.

<item found="461935">рублевское шоссе 36 корп ...</item>
<item found="171091">+380(50)657....</item>
<item found="35014">458.162.-.1-</item>
<item found="191493">e-mail: archi...@mail.ru</item>
<item found="48">gau-...@mail.ru</item> (email одного ген. директора)
<item found="69">dagteolog@mail.ru</item>
<item found="1061916">алекс.. ив... ,курск ... лет</item>
<item found="210129">Татьяна, 41 год, М... (название поселка)</item>
<item found="5822147">+7 932 421 .. ..</item>

Часто встречаются email адрес людей, телефоны (частные).
НЛО прилетело и опубликовало эту надпись здесь
Пароли да, при том часто это не вина пользователя, а чистая случайность. Например не дожал Ctrl+V, и вставил в поисковую строку то, что было в буфере перед этим — пароль. Всё, утёк, даже «найти» нажимать не надо.
наверное писалось про Ctrl+C?
Да, конечно.
«Смысл в обезличивании» в том, что это не всегда емейлы и телефоны авторов запроса. Контент запросов нужно фильтровать отдельно.
НЛО прилетело и опубликовало эту надпись здесь
Уже давно не предоставляют и не указывают в официальной статистике. О том что народ ищет тайно — стыдно и говорить…
Так было всегда и будет всегда. Умных и успешных людей (миллиардеров, политиков, космонавтов, музыкантов и так далее) вроде бы около 3.5 процентов. Остальные быдло, либо из-за своих комплексов, привычек и (или) проблем не смогли пройти в это число. Думаю повысить этот процент можно, однако потом, если этим не заниматься, опять всё устаканится.
Умных и успешных людей (миллиардеров, политиков, космонавтов, музыкантов и так далее) вроде бы около 3.5 процентов… Остальные быдло

Вы, я так понимаю, себя к умным и успешным относите?
А программистов в один ряд с космонавтами и музыкантами ставите? Вам-то наверное и порно в яндексе искать не нужно, достаточно в зеркало посмотреть
Совсем нет :) Я пока далеко не успешен и умен, с горой недостатков. Так что пока что я скорее 95%. Результаты, кстати, отфильтрованные, однако благо просто посмотреть их мы все можем и выводы напрашиваются сами. Если вы всё ещё верите, что человеки хорошие, то я уже давно разочаровался, в том числе и на себе самом.
Если вы всё ещё верите, что человеки хорошие, то я уже давно разочаровался, в том числе и на себе самом.

А почему мы должны в это верить да еще и разочаровываться? Природу нужно воспринимать такой, какая она есть.

Притом что считать недостатком?
Ну какой сколько людей, столько и мнений. Быть может я еще зеленый и глупый)
Умных и успешных людей (миллиардеров, политиков, космонавтов, музыкантов и так далее) вроде бы около 3.5 процентов

Не уверен что успех и разврат друг друга исключают. Периодически высплывают данные как тот или иной политик замешан в сексуальных домагательствах, развращении малолетних или даже обычном просмотре порносайтов на рабочем месте.
«Человек культурный» — феномен по определению искусственный.
Если лишить человека образования и воспитания, он опускается на уровень «ещё одного вида обезьян».
Поэтому вопрос скорее не «если всё пустить на самотёк», а «какая система распространения культуры и образования» установится силами активных членов общества и сопротивления остальных.
Осознание обществом ценности той или иной культуры вещь весьма относительная и субъективная, и кроме всего прочего замкнута на воспитание.
То есть, если увеличить процент осознанных граждан, не просто мотивированных, но и владеющих технологией повышения осознанности, осознанно выбирающих культурные ценности, возможно мы достигнем качественного скачка, после которого падение доли успешых и эффективных людей станет возможным лишь в результате разрушения защищаемой обществом и традициями инфраструктуры образования и воспитания.
На самом деле там всего ~12000 вариантов запросов крутится.
Чуть подробнее, пожалуйста.
Как узнали, всегда или через какой-то промежуток времени обновляется?
«Грабил» поисковые фразы, для последующего составления семантического ядра.
Скрипт крутился пару суток.
Через несколько часов после старта итоговый файл с фразами увеличиваться перестал.

Через какой промежуток обновляют — не могу сказать, не засекал.
нашел вот такую вещь
http://livequeries-front.corba.yandex.net/queries/?ll1=41.17915089295261,20.867207593750013&ll2=55.63987388074816,47.278340406250024&limit=1000
собственно тут в параметрах строки можно задавать и диапазон.
Используется она самими Яндексовцами в прямом эфире
По идее ты можешь считывать значения из /dev/urandom или /dev/random своего сервера скриптом.
Не очень бы я обрадовался, если бы меня попросили ввести что-то вроде «СТЕЛС ЕСЛИ В БОЮ ВАНИШ МАКРОС» или «rfr ljk;yj yfhfcnfn, [ux», или упаси господь что-нибудь длиннее.
Для этого есть кнопка «обновить», которую даже в reCAPTCHA частенько приходится нажимать.
В reCAPTCHA я это чаще делаю из-за того, что не могу разобрать, чего там написано. Хотя в последнее время мне чаще попадаются числа, что гораздо проще для восприятия, нежели «cl» или «d»
Только с третьего раза получилось верно. И я бы ещё сократил длину фразы.
Надергал из яндекса за пару минут
объектив ФЭД И-61Л\Д 2,8/53
nhfycajhvfnjh nlv-401\380d
USB\VID_07D1&PID_3C16
6x+5y=3 3x+3y=4
диагноз р2 б2z73.1.1, б9R461
مصرية افراح اغاني شعبية
0_o идея хорошая, но фильтровать нужно очень жестко, а то рекапча покажется детской игрушкой )
Меня порадовало «Патятливый»

А вот выдача на «Смотреть блондинка в шоколаде» разочаровала…
Идея отличная. Чем вводить очередные Leveclers Snemrilililibs, лучше уж что-то такое:
самый лучший курятник фото
рыжий шпиц фото
где посылка
кончаться огонь
малолетние граждане это тесты
как отбить бывшую девушку
мыло ручной работы для чего
деский возрост и хурма
корень из 27

(пардон, форматирование не вставилось)
Это просто прекрасно, спасибо!
дон камизи перевод
что такое промокод
как потеет бегемот
почему я идиот

вот тоже не плохо курнули
техника машинного доения
полимеры в авиастроении
если человек не в настроении
половые органы строение
7 июня 2014, гроза
Ну и романтики немного…
кленовые листья раскраска
упрямые женщины ласка
поэма есенин
плащ теплый осенний
гармонь развеселая пляска
НЛО прилетело и опубликовало эту надпись здесь
Так вот откуда современная попса тексты берет…
Огромное тебе спасибо, добрый человек! Ты просто сделал мой день :)
Поэма
тест на характер человека
что подарить на новый год
синоним к слову картотека
а снег идет а снег идет
енотовидная собака
парфюм по знаку зодиака
как увеличить капитал
скачать владимирский централ
пусть говорят официальный
не плачь и жди меня домой
стерилизатор паровой
костюм джедая карнавальный
картон асбестовый каон
как затуманить задний фон

НЛО прилетело и опубликовало эту надпись здесь
А будет ли nginx работать в неблокирующем режиме, используя функции imagemagick?
imagemagick используется через FFI, никакие файлы при этом не читаются, так что да.
Пришел к выводу, что я робот.
А где можно почитать про это АПИ и какие условия пользования?
Если я буду его пользовать, то меня быстро забанят или не очень?
Я про АПИ яндекса конечно…
А для гугла такая же выборка есть? Хотел бы сравнить запросы аудитории mail.ru, google и яндекса.
Побочный эффект: эффективно отсеивается нерусскоязычная аудитория. Для кого-то это может быть важно.

Ещё, подозреваю, возможна timing attack (кстати, какой адекватный перевод этого термина на русский язык?).
атака по времени
С такой капчей ждите массового оттока посетителей. Можете даже A/B-тестирование провести
Да не надо ничего проводить даже…
n\c

Гадание по капче получило второе дыхание
Не понял. Т.е. бот может получить тот же список, и подставлять из крайне ограниченного числа вариантов перебором? =) Капча так не работает. Капча работает не так.
А разве количество попыток не ограничивают при вводе капчи? Просто опасть на пересечение двух рандомных фраз одного списка — шанс к нулю стремится.

Вру. Не к нулю. Если бот будет брутфорсить с одной и той же фразой — шанс велик.
image

Извините, но вы меня не заставите вводить этот текст. Лучше уж 12-ти символьную капчу ввести./sarcasm>
Собственно оттуда же и берутся данные
так и вижу как ваш ребенок вводит: «негры гей порно», а потом спрашивает что всё это значит? :)
Кажется хаброэффект и компания Яндекс, читающая хабр, уже прикрыли эту интересную страничку
image
Там просто referer проверяется. Вставьте ссылку в адресную строку и зайдите так.
Хммм… Спасибо.
Мне идея непонятна. Если это юмор, то не смешной. Матан-капча прикольней:
image

Если это для практической реализации, к чему тогда тут запросы к Яндексу? Взяли бы сочинения Пушкина, на строки побили бы и вывели для ввода.
Считать человека круче компьютера в матане может и прикольно, но глупо.
Сочинения Пушкина = известный словарь, а идея брать относительно случайные данные.
Ненавижу тех людей, которые ставят капчу на языке, написание которого отлично от латиницы. У меня на многих устройствах мало того, что нет русской клавиатуры, нет еще и поддержки ввода кириллицы. Задолбали, в общем. Не надо так!
說聲謝謝,是不是中國人!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации