Как стать автором
Обновить

Комментарии 65

Первое предложение впечатляет. И почему это большинство людей не в курсе?
да, при переводе хорошо бы адаптировать, опуская неинтересные хабралюдям подробности
Я решил сохранить оригинальную форму повествования. Добавил комментарий в начало статьи, чтобы не вводить людей в заблуждение.
хорошие у них там" диссертации", хотя статья неплохая, спасибо
Странное дело, всё чаще диссертацией норовят назвать то магистерскую работу, то вот уже и бакалаврскую (автор статьи — «Mr. Ben Boyter, a Bachelor of IT»). При этом саму степень почему-то не уточняют, так что даже 30-страничная курсовая работа диссертация третьекурсника прозвучит не менее внушительно, чем докторская…
У буржуев так принято. «Диссертация» эквивалентна нашему «дипломная работа», а «дипломная работа» там вообще не употребляется.
Там просто одно слово на всех. Но именно поэтому обычно таки уточняют степень — bachelor thesis, master thesis, phd thesis. Cтранно, что в статье этого не сделано.
Ну так бакалавр — это не большой повод для гордости. Поэтому автор и упустил эту подробность для пущей важности.
Спасибо, добавил в начало информацию об авторе.
Не только у «буржуев». В этом году в российском вузе я защищал магистерскую диссертацию. У бакалавров дипломная работа носит название «выпускная квалификационная работа».
Особенно понравилась фраза «Капча устроена так, что человек может прочитать текст без труда», значит я не человек…
Да, привет рекапча
Вот, потренируйся:
image

p.s. может даже перестанешь смотреть на мир через розовые очки.
ну, чтобы разгадывать такие капчи нужно не писать код, а нанимать отдел сотрудников и тренировать их в течении нескольких лет :D
я не робот, но тоже не смогу расшифровать эту капчу :)
Я всё жду, когда роботы превзойдут в распознавании людей (может, уже?) и капча сменит смысл на противоположный.
я робот, и тоже не могу расшифровать эту капчу.
На самом деле рекапча бывает порой намного хуже этого. Сделать хоть что-то можно понять. Я прочитал — DDNTWW. А теперь попробуйте разгадать второе слово на рекапче

image

или на этой

image
можно ввести мусор вместо второго слова и оно прокатит.
а можно бессовестно вообще ничего не вводить :)
второе слово написано на иврите из 10 букв, на первой картине.
на второй, слово ли это?!
кстати да, я регулярно встречаю в рекапче такие артефакты. Они напоминают криво вырезанные фрагменты отсканированных текстов. Возможно, баг при обработке исходных материалов для капч.
НЛО прилетело и опубликовало эту надпись здесь
Ради интереса перевел в гугле эти первые четыре буквы, получилось: חברת = company = компания.
Можно сделать вывод, что Хабрахабр с иврита переводится, как Компания компаний (или Сообщество сообществ)
НЛО прилетело и опубликовало эту надпись здесь
На арамейском, «хабр» — друг в сопряжённом состоянии, «хабра» — в эмфатическом. (пруф)
«хабр-хабра» на арамейском значило бы «друг друга».

А ивритский текст на картинке — חברת התפלות, «компания по опреснению»
omg, как выглядит друг в сопряжённом состоянии?
Ну, я догадался, что это лингвистика, придрался к неоднозначности исходного предложения :)
Первоисточник, впрочем, подтверждает, что там "תבות התפלות" — «слова молитв» в сокращённом написании.

Получается новый современный вид спиритизма — гадание на капче :)
мой последний опыт с такой капчей убил у меня всякое желание рагистрироваться на ресурсе. Я потратил несколько минут на борьбу с ней, постоянно обновляя её, чтобы наконец-то найти читаемую для человека!

Я использовал на своем ресурсе такую капчу пару недель. Это не останавливало ботов.
Тогда я заменил капчу вопросом из серии:
«вода, земля, воздух, огонь, мороженое» — какое слово здесь лишнее.

и ботов больше не регистрировалось. Только люди. :)
Я думаю, что для ботов будет достаточно скрытового поля, при заполнении которого они палятся. Тут смысл другой — предотвратить атаку на конкретный сайт, но в таком случае капча все равно не помогает, т. к. есть сервисы подобные антигейту
О смысле таких капч предлагаю посмотреть следующую TED-лекцию. Одно — «понятное» — слово сгенерировано для стандартной проверки на робота. Второе — является частью работы по оцифровке книг. Его не распознал компьютер, можете не расшифровать и вы, так что достаточно ввести хотя бы первое слово. Смысл в том, что попадаются и более ясные случаи, и если несколько пользователей одинаково распознали такой отрывок, этот вариант и принимается как исходный текст.
Но, ведь второе слово читать, при подтверждении рекапчи, не надо.
Я упорно читаю это как DNIWE
Это лечится?
рекапча дошла до того, что я сам её уже не могу разгадать. Приходится постоянно нажимать refresh, чтобы дала что-нибудь полегче
+100. Бывает, что вроде и выбрал, что полегче, ввел текст — а тебе говорят — «Неправильно!». Я тут на днях минут 10 боролся с такой капчей. Раз двадцать рефрешил текст, раз 5-6 вводил. Пока зарегистрировался — забыл уже, зачем я на тот сайт рвался-то…

В общем, эта система себя изживает, ИМХО. Надо придумывать что-то принципиально другое для отсева ботов.
Я обычно угадываю ее с раза 10
И ради такой до неприличия простой капчи столько текста?
Можно было и посложнее взять.
Автор статьи не я. А насчет объема текста — думаю, что автор хотел объяснить как это делается для новичков и те, кому это интересно развивались дальше.
в общем-то, весь процесс распознавания капч можно разбить на этапы:
1. удаление шума и искажений
2. бинаризация (удаление лишней информации: цвет, фон...)
3. сегментация (разделение на отдельные символы)
4. распознавание символа

и у каждого этапа есть свои трудности и для различных капч могут подойти различные методы. универсальным методом, к сожалению, остаются только «индусы»
Напоминает алгоритм генерации капчи, записанный наоборот ;)
Все это круто, но на практике мало кто применяет такие подходы, а используют сервисы типа antigate.com в своих ботах/парсерах. Дешевле платить $1 за 1000 капч, чем день, если не больше, работы программиста по анализу и реализации алгоритма взлома капчи.
Большинство людей не в курсе кто я…
интересно, что можно сделать, например, с такой капчей:
image
Здесь всё довольно просто.
0. Бинаризация.
1. Символы хорошо разделены, шумы незначительны; сегментация не вызовет проблем.
2. Можно выделить контуры символов и по ним делать распознавание.
3. Шрифт одинаковый, размеры символов неизменяемы, повороты незначительны. Поэтому можно использовать нейронную сеть.

через pixodrom.com можно решить такую капчу
Уж больно примитивная каптча в примере. Шрифт — Sans Serif. Можно просто по маске распознавать.
Как же далеко это от искусственного интеллекта!
Гуманитарии минусуют, технари вбивают в wolfram alpha и получают ответ.
Технари решают это руками, тем более что ничего сложного здесь нет.
Если человек вызубрил формулы это делает его лучше остальных? Гордитесь тем, что может сделать ученик средней школы?

Технарь != человек-калькулятор.
Не понял, что вы имеете в виду.

Во-первых, никакие формулы зубрить здесь не нужно. Под корнем, очевидно, находится бесконечно малая в точке функция (т.к. произведение ограниченной и бесконечно малой). Корень, соответственно, тоже будет бесконечно малой функцией. Значит, под логарифмом стоит сумма константы и бесконечно малой функции, откуда предел равен ln 2. Где здесь хоть одна «вызубренная формула»?

Во-вторых, при чём здесь ученик средней школы?
Признаю — ляпнул не глядя. Матанализ не трогал с первого курса — успел все позабыть (были у меня сложности с организацией учебного процесса тогда + не очень люблю его).

Средняя школа — к тому, что чем старше, тем менее хочется считать руками. В школе быстро перемножал многозначные числа в уме — сейчас медленно и предпочту калькулятор. Да, может тренирует мозг — но я не считаю что быстро считать чем-то ценно в ХХI веке.
Это скорее защита от людей, чем от ботов.
если капча пройдена, значит бот
Непонятно, как ответ вводить. ln2? ln 2? 0.69? 0.6931471805599453094172321214581765680755001343602552?
@Norvind не стоит оно этого, даже для технарей. Можете смело распрощаться с посетителями вашего сайта с такой капчей, ну если конечно он не сугубо профильный (математический)
Nordvind конечно же, прошу прощения.
Ну так никто и не говорит, что это ставить надо везде. Но ИМХО бывают ситуации, когда сайт стоит того, чтобы решить такое, да и отпугнет флудеров.
Пожалуй, это должно быть в виде расширения для браузера. :)
Хорошая идея!
К сожалению, эта статья опять про распознавание не очень то и сложной капчи. Такие на хабре уже были: 1, 2.

Вот существует ли методы и алгоритмы для приемлемого распознавания kcaptcha2, даже имея исходный код ее генерации?

image
>«даже имея исходный код ее генерации»

Знание алгоритма генерации MD5-хэша не даёт вам возможности восстановить исходную строку по его значению.
Так же и здесь.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории