Pastafarianist Mar 25 2011 at 21:37

Распознавание некоторых современных CAPTCHA

15 min

78K

Python*Algorithms*Image processing*

From sandbox

+307

148

Comments 148

snizovtsev Mar 25 2011 at 21:49

Спасибо, отличная статься!
p.s. пошёл настраивать sms уведомления об поступивших email (оператор red).

Pastafarianist Mar 25 2011 at 22:10

Научите?

librarian Mar 25 2011 at 22:32

C моим, относительно небольшим количеством email, меня бы быстро задолбало. А их всего то порядка сотни-полутора в день.

-1

Error_403_Forbidden Mar 25 2011 at 23:32

Не забудь запастить списком качественных прокси, иначе сразу забанят.
Проверено.

qweewq Mar 26 2011 at 19:02

Напишите статью ;)

link0ln Mar 28 2011 at 08:43

ээмм, велосипеТ. Я пользуюсь услугой е-майл на смс. Услуга бесплатна. Я живу на урале и мой почтовый смс ящик вида 7XXXXXXXXXX@sms.ural.mts.ru. В интернет помощнике можно подключить также бесплатно.
А за статью автору спасибо огромное!
ps: в моду входят капчи вот такого вида как здесь keycaptcha.com, как говорится «а вам слабо» ;)

SSar Mar 28 2011 at 09:51

Не у всех операторов и не во всех регионах работают почтовые шлюзы.
Многие пашут только в Москве/Питере, некоторые операторы данную услугу включают по заявлению, порой даже за $$.

link0ln Mar 28 2011 at 10:04

хм, возможно, спорить не стану… но опять же… в таком случае ~50% распознавание не думаю что устроит вас при работе с пересылкой уведомлений, вариант только если отслеживать результат ввода.

SSar Mar 28 2011 at 10:57

Я уже задавал этот вопрос общественности на хабре:
Подскажите шлюзы EMAIL->SMS для различных операторов и/или сервисы по отправке SMS для физ.лиц

Smi1e Mar 25 2011 at 22:06

Никогда не приходило в голову, что все наши крупнейшие операторы аккуратно заняли 4 основных цвета хотя это и довольно очевидно.
За теорию спасибо, поздравляю с победой!

borsh Mar 26 2011 at 00:32

«4 основных цвета»

Yellow = Red + Green как бы.

nekt Mar 26 2011 at 03:35

так то в специальном цветовом пространстве — RGYB

Stalker_RED Mar 29 2011 at 00:40

может GRYB?

VitaZheltyakov Mar 25 2011 at 22:09

Статья хорошая, но повторяет ошибки предыдущих статей, которые публиковались на Хабре.
Зачем использовать нейросеть с сравнением с шаблонами изображений цифр? Можно для большинства из приведённых случаев (кроме последнего) использовать математический анализ. Он даст более высокий коэффициент угадывания и алгоритмы будут легче.
Суть математического анализа сводится к подсчёту количества точек разного цвета. То есть изображение делиться сеткой на 4-9 участков и подсчитывается количество белых точек + общее количество точек. Для каждой цифры соотношение количества точек в разных участках уникально, что позволяет легко довести коэффициент угадывания до хороших результатов.
Этот метод хорошо работает, если цифры имеют наклон не более 30 градусов и не пересекаются.

Особое спасибо за алгоритмы выделения отдельных цифр — это хорошая работа.

+12

Pastafarianist Mar 25 2011 at 22:14

Если у вас термин «математический анализ» ассоциируется с подсчётом точек — я Вам искренне сочувствую.
Этот метод не будет работать в более-менее сложных случаях. Скажем, в первом — там размер символов слишком мал, чтобы производить подобные спекуляции.

-3

tronix286 Mar 25 2011 at 22:42

Да не, я бы тоже не заморачивался с нейросетями и сравнивал тупо по шаблону (с разным наклоном). Да, грубо и немного затратно по времени выполнения, зато результат был бы около 100% + пишется за пять минут.

YasonBy Mar 26 2011 at 03:37

А автор — «заморочился», и именно за это получил бумажку с римской цифрой.
Но Вы, конечно, смогли бы сделать его работу за пять минут, просто «не заморачивались».

nekt Mar 26 2011 at 03:39

Можно попросить вас на выходных потратить пять минут своего времени и показать вашу идею в виде кода? Мне интересно посмотреть, как можно добиться таких высоких темпов в разработке.

tronix286 Mar 26 2011 at 07:53

Увы, в выходные я работаю. Вот сейчас уже выхожу из дома и буду только поздно вечером. Но намек я понял, попробую «заморочиться» в понедельник-вторник.

Pastafarianist Mar 30 2011 at 21:57

Среда подходит к концу, а «заморачивания» не видать…

Siddthartha Mar 25 2011 at 23:53

он прав. это подход вобщем математического, а в частности статистического анализа. так вполне можно сказать.
и в противовес итерационной магии нейросети, при таком подходе используются более быстрые, точные и простые вычисления.

Pastafarianist Mar 26 2011 at 01:37

Которые, однако, вряд ли дадут приемлемый результат в условиях большого алфавита (заметьте, «только цифры» — один раз из четырёх) и слишком маленького размера изображений.

Если интересует — попробуйте применить этот метод и сравните его эффективность с нейросетями. Зачем начинать холивары на пустом месте?

TheShock Mar 27 2011 at 00:14

Я с вами однозначно согласен в одном. Самое правильное завершение спора — ещё две статьи.
1. С описанием математики
2. Сравнение

Palehin Mar 25 2011 at 22:36

Отличная статья! Одназначно в избранное! Выходные предстоят занимательные)

ruASG Mar 25 2011 at 22:38

Ура! Ну хоть кто-то присоединился ко мне в использовании лицензий Creative Commons на Хабре!

На счёт запрета коммерческого использования. Действительно ли вам нужен этот запрет? Ведь никто не сможет, например, перевести вашу статью на английский язык для какого-нибудь сайта с рекламой (но из-за SA ваше произведение и на английском языке осталось бы свободным). Вашу статью даже нельзя скопировать в ЖЖ, потому что там тоже висит реклама. В общем, посмотрите почему запрет коммерческого использования — это плохо и запрещайте только если вам это очень нужно.

Pastafarianist Mar 25 2011 at 22:47

Понимаете, это тонкий намёк на то, что я не одобряю спам.

ruASG Mar 25 2011 at 22:55

Совершенно не понял что вы имели ввиду. Это вы свободные лицензии спамом назвали или ссылки, которые я привёл?

Pastafarianist Mar 25 2011 at 23:06

Спамом я называю одно из потенциально возможных применений моей программы.

tarepanda Mar 26 2011 at 05:57

Спамеры, соблюдающие лицензии? Оригинально.

+11

veprbl Mar 25 2011 at 23:51

Вы указали только лицензию на сам текст, в то время как читатель имеет право использовать полученную в результате чтения вашей статьи информацию в любых целях. Сам код вы раздаёте под GPL, так что спаммеры могут его спокойно использовать (соблюдая условия, конечно).

Статья мне очень понравилась. Поздравляю с победой!

Pastafarianist Mar 26 2011 at 01:40

Нормально ли писать, что лицензия распространяется на «текст, а также всю информацию, в нём содержащуюся»? А также изменять условия лицензирования после публикации статьи? :)

veprbl Mar 26 2011 at 02:24

А как вы определите, что такая-то информация у меня в голове сформировалась именно только после прочтения вашей статьи?)
Изменять условия можно, вы же автор, но все те кто успел скопировать текст до этого, получается получили его на старых условиях.

middle Mar 26 2011 at 09:03

Информация не защищается законодательством об авторском праве. Законодательством защищаются лишь произведения.

Увы, автор с этим ничего поделать не может. Пусть думает что хочет, но юридически он не прав.

UFO just landed and posted this here

Pastafarianist Mar 26 2011 at 18:25

Благодарю за разъяснения. Сменил лицензию на CC BY-SA.

Dragonizer Mar 26 2011 at 17:43

На хабре тоже есть реклама. Pastafarianist нарушает лицензию собственного текста? :)

-1

Pastafarianist Mar 26 2011 at 17:53

Да? Странно. Сайтом пользуюсь уже полгода, ни разу никакой рекламы не видел.
Меня посещают смутные подозрения. AdBlock?

-1

ruASG Mar 26 2011 at 18:39

Автор может делать со своим произведением всё что угодно и в том числе размещать на сайте с рекламой. Лицензия на автора не распространяется. Лицензия — это для других.

Dragonizer Mar 26 2011 at 20:23

Логично. Пардон.

TheShock Mar 27 2011 at 00:20

Ура! Ну хоть кто-то присоединился ко мне в использовании лицензий Creative Commons на Хабре!

У меня к вам прямой вопрос. Я туго разбираюсь в лицензиях, но давно хотел найти какую-нибудь свободную лицензию для текстов. Что-то типа LGPL или MIT. То есть близкая к полной свободе, но не «передача в публичное достояние». Типа, «за мной сохраняются авторские права, но можете делать со статьёй все, что угодно».

Что посоветуете?

Pastafarianist Mar 27 2011 at 01:06

Creative Commons Attribution-ShareAlike (CC BY-SA) — её, в частности, использует Википедия (можно увидеть в подвале любой статьи).

TheShock Mar 27 2011 at 23:23

Спасибо)

ruASG Mar 27 2011 at 23:18

Судя по таблице у MIT совсем нет копилефта, тогда вам подходит её аналог в мире контента — безкопилефтная Creative Commons Attribution (CC-BY). Она как бы говорит нам: «делайте всё что угодно, только указывайте моё авторство». Кстати, для России что общественное достояние, что CC-BY — фактически одинаковы, по закону всегда надо указывать автора (а вот в США для произведения в ОД можно не указывать).

LGPL имеет слабый копилефт. Больше свободных лицензий имеющих слабый копилефт я и таблица не знаем. Но нормальный копилефт имеет Creative Commons Attribution ShareAlike (CC-BY-SA).

TheShock Mar 27 2011 at 23:23

А что у этой статьи была за лицензия раньше? Которая запрещает комерческое использование?
Спасибо за ликбез)

ruASG Mar 28 2011 at 02:10

CC-BY-NC-SA.

AgentSmith Mar 25 2011 at 23:00

А я капчу красного оператора предварительно трансформировал по постоянному шаблону.
3D-капч я также преобразовывал к прямоугольному виду. Так распознавать было проще и процент ошибок заметно сокращался.

Pastafarianist Mar 25 2011 at 23:09

Это вы пересказываете собственный опыт или предлагаете правки к тексту статьи?

-4

AndryX Mar 26 2011 at 00:12

Зачем все эти ссылки на lurkmore?

+10

Pastafarianist Mar 26 2011 at 01:32

Так и знал, что кому-то не понравится :(

AndryX Mar 26 2011 at 01:41

Но вы так и не ответили, зачем? Чему в них нравиться вообще? =\

Вы лишь заставляете читателя прерываться на определение адреса ссылки и отвлекаете его от главного.

Pastafarianist Mar 26 2011 at 02:09

Ну давайте разбираться, где же я отвлекаю этого бедного читателя.

Всего в тексте 5 ссылок на лурк. Из них три во вступлении, одна в заключении и одна — в самом начале текста про первую капчу. Таким образом, получается, что от технической части (в которой находятся все Глубокие Идеи (тм)) я читателя не отвлекаю вообще, и в то же время менее значимые части разбавляются этими самыми ссылками. Видите ли, я старался писать так, чтобы это читать было интересно.

Я ответил на Ваш вопрос?

AndryX Mar 26 2011 at 02:20

Неа. И что интересного добавили эти ссылки? Их все желающие уже видели, лурк для хабра — не новость.

Лично мне после первых трёх вообще уже ни на какие ссылки смотреть не захотелось, но была бы там ценная информация — прочёл бы всё.

Pastafarianist Mar 26 2011 at 02:45

Если для Вас лурк — не новость, Вы должны быть прекрасно знакомы с тамошним стилем статей, где за невинными на первый взгляд заголовками ссылок часто скрывается неожиданное содержание. Причём чтение статей подразумевает, что вы наводите мышку на все ссылки подряд, но переходите лишь по единицам из них. Здесь я подразумевал то же самое — после первой же ссылки на лурк читатель должен был понять, что его ждёт в дальнейшем, и просто не переходить по ссылкам на вышеупомянутый сайт.

Режим Капитана отключён.

-2

AndryX Mar 26 2011 at 12:32

Вы и комментатор ниже меня немного не так поняли. Я действовал соответственно вашему плану:
1. навёл мышку на первую ссылку, увидел лурк;
2. навёл мышку на вторую ссылку, увидел лурк;
3. навёл мышку на третью ссылку, увидел лурк;
4. попытался понять зачем они там, не получилось;
5. решил до конца статьи на ссылки не отвлекаться вообще тк. опыт мне уже говорил, что там ничего нового не увижу.

Но всё же, зачем ссылки если вы планировали, что на них переходить не нужно? Это ещё менее логично. Честно, когда моя логика говорит «нет», то я таких вещей просто не понимаю. Хотя против статьи в целом ничего не имею, она — торт.

Pastafarianist Mar 26 2011 at 14:23

Странно. Я только что пересмотрел начало статьи и получил результаты, несколько отличающиеся от Ваших.

Ссылки по очереди:

Балтийском научно-инженерном конкурсе,
CC BY-NC-SA
успешно решена. — Lurkmore
распознавание. — Lurkmore
Python
OpenCV
FANN,
профессионального инструмента отладки. — Lurkmore
эмпирически. — Lurkmore
правильно сказал, да?
Википедия
MinAreaRect2
Inpaint
реализацию
в специальной ветке фоума на своём сайте,
исходный код
файлы нейросетей
изображения.
Балтийском конкурсе
Intel ISEF
кому они нужны, — Lurkmore
функциональные
оси?
I2P
Netsukuku

Таким образом, Ваше высказывание выглядит, по меньшей мере, необоснованным.

-3

AndryX Mar 26 2011 at 14:26

Что за конкурс мне было не интересно, а про лицензию CC и ряд других вещей я уже читал. Отмаз сработал? :)

DnV Mar 26 2011 at 15:53

Вы же не могли не заметить, что текст ссылок не совпадает с названиями статей Lurkmore? Это просто тот же приём, как если писать в скобках «читай так-то», или перечёркивать более эмоциональный, но менее стилистически подходящий вариант. Помогает более точно выразиться. А наводить на ссылки — не такая уж сложная работа. Или вы с девайса с сенсорным экраном (тут ссылка на айпад) статью читали? ;)

danSamara Mar 26 2011 at 03:16

Подсказка: при наведении мышки видно куда ссылка указывает, если лурк не нравиться — не переходите, из-за чего сыр бор?

nekt Mar 26 2011 at 03:42

Опа. Я эти ссылки банально не заметил при чтении. Разве что заинтересовался политикой лицензирования.

По теме ссылок — это плоский не смешной юмор. Конечно лучше, чем если все в сухом стиле преподносить. Но можно было бы и поинтереснее пошутить.

Pastafarianist Mar 26 2011 at 15:45

Предложения, примеры?

-4

pandas Mar 26 2011 at 00:16

Спасибо, добавил в избранное!

Alexznadr Mar 26 2011 at 00:20

Любопытно, что многие капчаборцы используют нейронные сети для борьбы с поворотом изображений символов по сравнению с «эталоном».
Если сравнивать не обзбражение и эталон, а результаты применения к ним каких-либо преобразований нечувствительных к повроту — то результаты будут лучше а нейронные сети могут и не понадобится.

Беглое гугление по поводу преобразований нечувствительных к повороту выдаёт нам например слова «лог-полярное преобразование» + «вейвлет преобразование»

YasonBy Mar 26 2011 at 03:28

Любопытно, что в комментариях к любой толковой статье найдётся пачка теоретиков, знающих (понаслышке) 100500 методов, которые решили бы задачу в два счёта и со стопроцентной точностью.
Каким-либо обоснованием своих утверждений теоретики не утруждаются, ведь «беглое гугление» Гения куда значительнее, чем экспериментальные результаты черни…

Если Вы считаете, что «результаты будут лучше» — докажите, в противном случае это пустая болтовня.

nekt Mar 26 2011 at 03:43

за 5 минут получить 100% результат для любой капчи — не проблема.
Проблема только в том, что считать 5ю минутами, 100% результатом и любой капчей.

Kalobok Mar 26 2011 at 00:43

За статью спасибо, весьма познавательно. А насчет распознавания слипшихся символов (особенно в последнем случае) — первое, что мне пришло в голову, попробовать распознавать сразу пары или даже тройки. Конечно, возможных вариантов получится намного больше, но есть подозрение, что и качество заметно подрастет.

Pastafarianist Mar 26 2011 at 01:51

Возникает естественная проблема — а где брать образцы для обучения? Там алфавит на 22 символа, если хотим распознавать пары, понадобится, по крайней мере, 484 сегмента по 2 символа в каждом — в идеальном случае это 194 картинки, но идеальных случае в природе не бывает. Покажите мне человека, который добровольно согласится распознавать такое количество капч (китайских студентов и декапчер.ком не предлагать!). Я руками переименовывал все эти изображения, и, честно говоря, удовольствия мало. Это первое.

Второе — что-то я сомневаюсь, что при таком количестве различных образцов сеть сможет сделать вменяемое обобщение. Однако, проверке это утверждение не поддаётся из-за п.1.

Kalobok Mar 26 2011 at 05:22

Ну, для обучения можно нагенерить пары самостоятельно из одиночных символов — ведь примерный их вид известен. Думаю, должно прокатить. А вот со сложностью сети могут быть проблемы, это да. Но я бы попробовал.

prox Mar 26 2011 at 00:52

подкинули бы пару идей о эффективной борьбе с авто-распознаванием

Doman Mar 26 2011 at 01:09

Для каждой из каптч, автор описал плюсы и минусы. Если сложить плюсы и убрать минусы, то получится почти идеальная капча )

Pastafarianist Mar 26 2011 at 01:30

Ага, Ucoz к ней неплохо приблизился.

TiFFolk Mar 27 2011 at 00:27

Там человек то хер поймет, что написано.

Pastafarianist Mar 27 2011 at 01:08

Да, я это и имел в виду.

xiWera Mar 26 2011 at 01:55

Сделайте N наборов «порчи картинки» и накладывайте их случайным образом.
Из вышеперечисленного выделяется:
* разные цвета для букв
* разные аффинные преобразования для букв
* аффинные преобразования для всей строки
* 3d выпуклость
* пустые квадраты между буквами, буквами не являющиеся
* мусор
* переменное количество букв
* переменное направление чтения
* тестовый вопрос (введите каждую пятую букву на экране)

Идеальная капча должна выдавать строку подвергнувшуюся случайному набору преобразований. Так в один момент времени такая капча выдаст цветные буквы в 3d, в другой раз мусор и скривленную строку с вопросом и тп.

Pastafarianist Mar 26 2011 at 01:59

Если не ошибаюсь, что-то подобное реализовано у Webmoney.

AndryX Mar 26 2011 at 02:00

У них много различных вариантов генерации, но практически все распознаются проще простого.

insa Mar 26 2011 at 13:57

> Идеальная капча должна выдавать строку подвергнувшуюся случайному набору преобразований.

И в результате будет у вас 10% капч которые распознаются с полпинка, потому что такие преобразования выпали. И этого будет более чем достаточно.

xiWera Mar 26 2011 at 14:57

ага, если знать как распознавать конкретную капчу, есть много способов обдурить написаный кем-нибудь «детектор наложенных преобразований»

dimanjy Mar 26 2011 at 03:06

Показывайте не цифры/буквы, а фрукты-овощи, ну или фотографии знаменитостей :)

JayDi Mar 26 2011 at 07:22

Кошки

UFO just landed and posted this here

Pastafarianist Mar 26 2011 at 12:34

AndryX Mar 26 2011 at 13:52

Два чудища в масках скинхедов разрывают девушку с поднятыми руками пополам. Каков мой диагноз? :)

Pastafarianist Mar 26 2011 at 14:02

Segmentation fault.

DnV Mar 26 2011 at 17:06

Годен. Вот если бы в вашем описании фигурировали хотя бы демоны и девственница, а также употреблялись слова «срущие» и «насилуют»… )

AndryX Mar 26 2011 at 23:43

Ну монстры — это и есть демоны :D, а девственница ли девушка не известно, как и дальнейшие их действия.

Но я действительно сказал о том, что увидел на пятне :). И это меня беспокоит, хочу об этом поговорить :).

TheShock Mar 27 2011 at 00:24

Черт, увидел то же самое. Там ещё сиськи торчат. А точка посередине — это бляха от пояса.

AndryX Mar 27 2011 at 01:02

Ещё у неё одна нога или она бежит

UFO just landed and posted this here

Jabberwok Mar 26 2011 at 13:57

Распознать текст тут не сложно, потому что он не искажен. А потом заправляем сюда.

UFO just landed and posted this here

Pastafarianist Mar 26 2011 at 14:06

prox Mar 27 2011 at 09:15

По-моему капча должна быть невыполнима для бота и не навязчива для человека (может так), не все же Онотолии в третьем поколении.

Pastafarianist Mar 27 2011 at 15:10

Капча для xUSSR:

xiWera Mar 26 2011 at 01:45

Для детекта ограниченного набора образов с неизвестными аффиными преобразоваиями лучше всего использовать сверточные нейронные сети (они фактически разбивают картинку на набор признаков и по ним детект уже гораздо эффективней)

Pastafarianist Mar 26 2011 at 01:57

Сначала прочитал эпитет насчёт нейросетей как «сверхточные», много думал…

Да, я хотел их использовать. Но, к сожалению, FANN их не поддерживает, адекватных альтернатив (в первую очередь, по скорости) я не нашёл, а писать что-то своё — слишком сложно и долго.

P.S.: если кто-то заинтересуется темой, то в интернете проще найти информацию по запросу «convolutional neural networks».

kitaisc Mar 26 2011 at 02:02

Раньше, что бы защитится от ботов использовал капчу, но она не спасает. Спасло знание олбанского и проверка по словарю. Только живой человек сможет понять фразу «Сем памножыть натры».

Pastafarianist Mar 26 2011 at 02:15

Пробовали reCAPTCHA? Насколько я знаю, одна из самых сложных на текущий момент.

Насчёт олбанского — уверен, хороший парсер и словарь сломят и такую защиту :)

kitaisc Mar 26 2011 at 02:24

При использовании reCAPTCHA боты пробивались только так, а при таком варианте защиты ботов почти нет, т.е. есть подозрение, что рекламных ботов все таки регистрируют в ручную, но их так мало, что можно сказать, что их нет.

kitaisc Mar 26 2011 at 02:24

не туда )

Pastafarianist Mar 26 2011 at 02:30

Возможно, дело в том, что защита типа капчи слишком хорошо изучена, и для того, чтобы её пробить, используют ~~негров~~ бедных китайских студентов? В интернете же полно сайтов, предлагающих «вводить символы с картинок 1$/1000 шт.». То есть проблема не в устойчивости капч к распознаванию, а в людях, соглашающихся выполнять настолько бесполезную работу.

kitaisc Mar 26 2011 at 04:29

Проблема в том, что капчу с цифрами поймет даже бездушная машина, а высокослоговые предложения Русского языка поймет только НАШ человек )

Aracon Mar 26 2011 at 22:15

Слышал, что в последнем Хрумере reCAPTCHA автоматически распознаётся.

UFO just landed and posted this here

Pastafarianist Mar 26 2011 at 02:25

Вот что обидно — в конце статьи содержится Вопрос Жизни, Вселенной и проч., а ни один из комментариев даже не затронул эту тему. Неужели никто ничего не подскажет? :(

noonesshadow Mar 26 2011 at 03:20

Могу предложить две мысли (оценки трудоемкости не с меня :))

Первая, с минимальным научным компонентом. Интеграция большинства сторонних обновлений в Windows Update. Уверен, это было бы полезно сотням миллионов. Не знаю, как монетизировать, правда, но должен быть способ :) И подходит ли это под нужные конкурсы.

Вторая. Экономический анализ мира.
Компании, Люди, Государства. Тратят и получают деньги. Производят и потребляют товары и услуги. Добывают сырье. Находятся в постоянных отношениях друг с другом. В Сети, и не только, есть множество информации, иногда прямой, иногда косвенной — объемы продаж, цены, оценки стоимости компаний, сделки, прогнозы, уровни добычи. Задача — построить модель, которая находилась бы в состоянии постоянного уточнения с новыми данными. И позволяла увидеть экономику мира, с возможностью zoom in/ zoom out. Дальше — прогнозирование :)

Pastafarianist Mar 26 2011 at 11:53

Реализация первой значительно осложняется тем печальным фактом, что у меня, к сожалению, нет доступа к внутренностям Windows Update. Даже если бы я сделал аналогичный сервис, кто даст гарантию, что меня послушает M$?

Вторую вы описали весьма расплывчато (по крайней мере, для меня), хотя, конечно, звучит захватывающе. Но вот первая же мысль в связи с реализацией — нужно собирать статистику по интернету -> нужно аккуратно парсить содержимое статей по этой теме -> нужно понимать это содержимое -> нужно пройти тест Тьюринга :(

noonesshadow Mar 26 2011 at 16:12

В зависимости от страны, в которой вы находитесь, могут быть юридически чистые способы получения доступа к внутренностям на клиенте. Сервер, конечно, понадобится свой :)

Вторая — реализация точно не будет простой :)

HomoErectus Mar 26 2011 at 02:50

а какой хоть ноутбук?
интересно ведь.

Pastafarianist Mar 26 2011 at 11:56

Dell Inspiron Mini 1018. Это, конечно, нетбук, и стоит он соответственно, что не мешает мне в полной мере наслаждаться победой :)

aml Mar 26 2011 at 08:47

Спасибо за статью, отлично написано. Вот вопрос возник по последней капче, там где цифры загораживали соседей. Нельзя ли на вход нейронной сети подавать +1, где чёрный пиксель, -1, где белый, и 0, где серый (иными словами, где он загорожен соседней цифрой)? Может ли нейронная сеть воспринимать среднее нейтральное значение как «неизвестность» и принимать решение на основе только тех пикселей, которые ей известны?

Pastafarianist Mar 26 2011 at 11:47

Вы не поверите…

mrded Mar 26 2011 at 09:43

Хабр и капча

Pastafarianist Mar 26 2011 at 12:02

Да, я это раньше читал. Попутно подумал, что новую «святую» капчу я смогу распознать где-то на уровне 30-40%, ибо свято верю в мощь нейросетей, а препроцесс и сегментация там весьма тривиальны. Впрочем, печально, конечно, что администрация позволяет себе такое.

Karbas Mar 26 2011 at 12:01

Спасибо, статья интересная и легко читается.
Автор, а вы не хотите поучаствовать в Инетрнет-Математике 2011? Там вроде как раз про работу с изображениями в этом году.

Pastafarianist Mar 26 2011 at 12:04

Первый раз слышу об этом конкурсе.

Думаю, нет. До дедлайна два месяца, а дел по горло, тем более что придётся разбираться в новой для себя теме. Не успею.

Oenomaus Mar 26 2011 at 14:01

Идеальная капча блаблабла, пока есть индусы, любая капча обходится в такие копейки, что спам будет процветать. Я вообще удивлен, что многие монстры индустрии до сих пор пытаются капчами что-то закрывать. Эта защита устарела лет на десять.

Nordvind Mar 26 2011 at 14:22

Если нет под рукой Wolfram Mathematica, с матан-капчами они повозятся =)

Oenomaus Mar 26 2011 at 14:59

Бррр, куда они повозятся? Если человек не в состоянии распознать капчу без дополнительных средств, то зачем такая капча?

А я понял, вы не так поняли мое упоминание об индусах :)

Pastafarianist Mar 26 2011 at 14:35

С вами несогласны Google, Yahoo, Wikipedia, Windows Live и ещё тысячи сайтов поменьше.

Oenomaus Mar 26 2011 at 15:09

Ага, я именно про этих монстров индустрии и говорю, хотя в свое время мы легко сотнями регистрировали аккаунты на gmail обходя капчу именно дешевыми человеческими ресурсами, а не сложными и громоздкими система на основе нейронных сетей и прочего.

Задача капчи по сути — сделать автоматическую регистрацию аккаунтов в системе дорогой. То есть чтобы потенциальный «спамер» не делал сотни аккаунтов легких нажатием кнопки или делал бы, но для этого ему бы пришлось создать ПО, которое было бы настолько дорогостоящим, что затраты на него не окупались бы прибылью полученной с этих аккаунтов. При этом основная проблема капчи — она еще и человеком должна нормально распознаваться, не напрягая его.

Так вот основная проблема в том, что эта система легко обходится человеком и до тех пор, пока есть индусы, капча защищает лишь от школоты, которая решила нарегать себе кучу аккаунтов примитивными программками. Профессионалы давно решили эту проблему человеческим фактором и использование капчи в качестве защиты давно устарело.

Это не пришлось бы объяснять людям, которым хоть раз понадобилось бы зарегистрировать в какой-либо системе с капчами больше сотни аккаунтов. Основная проблема современных систем защиты в том числе и у монстров индустрии состоит в том, что у них на работу приняты крутые спецы по защите, которые никогда не работали по другую сторону. Они борются с проблемой, которая им кажется, а не с той, которая есть на самом деле.

Oenomaus Mar 26 2011 at 15:10

Да, а на тему альтернативного мнения, миллионов, которые не могут ошибаться и блаблабла, именно благодаря этому деньги в мире делятся 80/20, а не наоборот :) Пока ставятся защиты типа капчи, спамеры будут грести миллионы лопатами :)

insa Mar 26 2011 at 14:44

Господа, «взламывающие» капчи. Вам сей мессадж.

Капча — это штука позволяющая отсеивать низкопрофессиональных спаммеров. Это первая линия обороны от спама на ваш сотовый телефон, ваш форум, в вашу гостевую. К сожалению она не совершенна, и совершенной быть не может. Но ничего лучше пока не придумали.

Поэтому помните, что выкладывая в паблик вот такие статьи с исходниками вы делаете ровно одну вещь — уменьшаете входной порог для всевозможных спамеров. Думаю это единственные люди, которые скажут вам спасибо.

Pastafarianist Mar 26 2011 at 15:04

А вторая линия обороны точно существует?

insa Mar 26 2011 at 16:11

У оператора green вторая линия точно есть. Насчет остальных не знаю.

andreypaa Mar 26 2011 at 15:04

С таким подходом вообще треть интернета можно снимать с публикации ;)

Oenomaus Mar 26 2011 at 15:15

Капча — это морально устаревшая защита, мешающая нормальным людям. Меня вот вымораживают капчи с разными оттенками, как человека, не различающего некоторые оттенки зеленого, для меня это катастрофа. Я встречал сайты, где не регался по причине того, что с трех раз не смог правильно ввести капчу и т.д. Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно. Но чтобы их придумать и понять надо сначала попробовать поработать с другой стороны.

А эта статья интересна не с точки зрения капч, а с точки зрения распознавания символов, мне вот таких статей не хватало в институте на занятиях по нейронным сетям. А с точки зрения информационной безопасности — статья не несет серьезной смысловой нагрузки.

Pastafarianist Mar 26 2011 at 15:51

Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно.

Не будьте голословными. Объясните хотя бы в общих чертах, что вы имеете в виду.

А с точки зрения информационной безопасности — статья не несет серьезной смысловой нагрузки.

Предлагаете перенести в другой блог?

UFO just landed and posted this here

Pastafarianist Mar 26 2011 at 17:31

Уговорили. Перенесу по истечении 24 часов с момента публикации.

-1

Oenomaus Mar 26 2011 at 16:46

Насчет неголословности обязательно объясню, но чуть попозже, когда у себя на сайте оттестируем защиту и убедимся в достаточной эффективности, чтобы действительно не быть голословными. С другой стороны в паблике это точно не будет выкладываться, потому что до появлени в паблике это будет как раз эффективной защитой :)

вот ниже правильно предложили в обработку изображений. я бы там такую статью скорее стал искать.

insa Mar 26 2011 at 16:20

> Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно.

Поделитесь информацией. Спасёте интернет от капчи.

Oenomaus Mar 26 2011 at 16:46

Ага или помогу спамерам в очередной раз модернизировать свой софт :) Не для паблика и после тестов.

Ice_venom Mar 26 2011 at 21:35

Ну рас пошла такая тема, выложил свой ммс флудер зеленого оператора с автораспознаванием капчи.

Pastafarianist Mar 26 2011 at 21:48

Там сейчас другая капча, почти нечитабельная.

-1

Ice_venom Mar 26 2011 at 21:50

Ну вот, слишком поздно кинул в паблик:(
Но в любом случае можно декомпильнуть и посмотреть что-как.

Pastafarianist Mar 26 2011 at 21:59

Да ладно, судя по скрину, в старой капче ничего сложного не было :)
Кстати, по-моему, новая тоже сложная только для человека, компьютер с ней легко разберётся.

-1

EiZeRR Mar 27 2011 at 00:26

хорошая работа.

я не буду писать про то, что распознавать капчу автоматическими методами нерентабельно уже года 3:)

Pastafarianist Mar 27 2011 at 01:21

В таком случае воспринимайте статью просто как описание подхода к распознаванию символов.

-1

afiskon Mar 31 2011 at 15:14

Скажите, я правильно понял, что в каждом случае во втором слое вы использовали ровно три нейрона?

Pastafarianist Mar 31 2011 at 23:30

Нет. Просто иллюстрация неудачная :)

Я экспериментировал с различным количеством нейронов во втором слое, и остановился на одной трети от числа нейронов первого слоя.

afiskon Apr 1 2011 at 08:07

При условии, что на вход подавалась ч/б картинка 30 x 30? Ее никак перед этим не изменяли (усреднение цвета по соседним пикселям и тп)?

Pastafarianist Apr 1 2011 at 23:22

Вообще-то, статья как раз и посвящена тому, что делается с этой картинкой до передачи её в нейросеть. В статье были примеры изображений перед самой передачей:

Pastafarianist Mar 31 2011 at 23:33

Уважаемый минусатор. Скажите, вы испытываете какое-то особое удовольствие от того, что у всех моих последних комментариев ровно по одному минусу?

-1

AgentSmith Nov 13 2012 at 01:02

А не проще ли воспользоваться пиксодромовским сервисом антикапчи Pixodrom? ( pixodrom.com )

Pastafarianist Nov 13 2012 at 01:32

Задача была именно написать программу распознавания, а не спамить.

Delphist2008 Mar 29 2013 at 14:21

Буду очень благодарен, если кто-нибудь объяснит, как это запустить.Перепробовал штуки 3 разных версий питона, ещё 3 разных opencv, но запустить не смог.Желателен ответ в духе «поставить такую-то версию питона, такую-то openc, скопировать то-то туда-то, затем там-то нажать такую-то кнопку».

Pastafarianist Mar 29 2013 at 22:48

Всё писалось под Python 2.6.6, OpenCV 2.1, FANN 2.1.0beta. Но установка OpenCV и FANN — это весьма трудоёмкий процесс, и 2 года спустя я уже не смогу описать вам все детали. Впрочем, что касается FANN: где-то в интернете я видел хорошую инструкцию по его установке под Linux, попробуйте погуглить.

Dmitriy002 Feb 17 2023 at 16:16

Не одобряю вашу работу - вы сделали плохое дело. Ваша работа не принесла никакой пользы, а только создала проблемы.

Show the best of all time