Pull to refresh

Comments 147

Спасибо, отличная статься!
p.s. пошёл настраивать sms уведомления об поступивших email (оператор red).
C моим, относительно небольшим количеством email, меня бы быстро задолбало. А их всего то порядка сотни-полутора в день.
Не забудь запастить списком качественных прокси, иначе сразу забанят.
Проверено.
ээмм, велосипеТ. Я пользуюсь услугой е-майл на смс. Услуга бесплатна. Я живу на урале и мой почтовый смс ящик вида 7XXXXXXXXXX@sms.ural.mts.ru. В интернет помощнике можно подключить также бесплатно.
А за статью автору спасибо огромное!
ps: в моду входят капчи вот такого вида как здесь keycaptcha.com, как говорится «а вам слабо» ;)
Не у всех операторов и не во всех регионах работают почтовые шлюзы.
Многие пашут только в Москве/Питере, некоторые операторы данную услугу включают по заявлению, порой даже за $$.
хм, возможно, спорить не стану… но опять же… в таком случае ~50% распознавание не думаю что устроит вас при работе с пересылкой уведомлений, вариант только если отслеживать результат ввода.
Никогда не приходило в голову, что все наши крупнейшие операторы аккуратно заняли 4 основных цвета хотя это и довольно очевидно.
За теорию спасибо, поздравляю с победой!
так то в специальном цветовом пространстве — RGYB
Статья хорошая, но повторяет ошибки предыдущих статей, которые публиковались на Хабре.
Зачем использовать нейросеть с сравнением с шаблонами изображений цифр? Можно для большинства из приведённых случаев (кроме последнего) использовать математический анализ. Он даст более высокий коэффициент угадывания и алгоритмы будут легче.
Суть математического анализа сводится к подсчёту количества точек разного цвета. То есть изображение делиться сеткой на 4-9 участков и подсчитывается количество белых точек + общее количество точек. Для каждой цифры соотношение количества точек в разных участках уникально, что позволяет легко довести коэффициент угадывания до хороших результатов.
Этот метод хорошо работает, если цифры имеют наклон не более 30 градусов и не пересекаются.

Особое спасибо за алгоритмы выделения отдельных цифр — это хорошая работа.
Если у вас термин «математический анализ» ассоциируется с подсчётом точек — я Вам искренне сочувствую.
Этот метод не будет работать в более-менее сложных случаях. Скажем, в первом — там размер символов слишком мал, чтобы производить подобные спекуляции.
Да не, я бы тоже не заморачивался с нейросетями и сравнивал тупо по шаблону (с разным наклоном). Да, грубо и немного затратно по времени выполнения, зато результат был бы около 100% + пишется за пять минут.
А автор — «заморочился», и именно за это получил бумажку с римской цифрой.
Но Вы, конечно, смогли бы сделать его работу за пять минут, просто «не заморачивались».
Можно попросить вас на выходных потратить пять минут своего времени и показать вашу идею в виде кода? Мне интересно посмотреть, как можно добиться таких высоких темпов в разработке.
Увы, в выходные я работаю. Вот сейчас уже выхожу из дома и буду только поздно вечером. Но намек я понял, попробую «заморочиться» в понедельник-вторник.
он прав. это подход вобщем математического, а в частности статистического анализа. так вполне можно сказать.
и в противовес итерационной магии нейросети, при таком подходе используются более быстрые, точные и простые вычисления.
Которые, однако, вряд ли дадут приемлемый результат в условиях большого алфавита (заметьте, «только цифры» — один раз из четырёх) и слишком маленького размера изображений.

Если интересует — попробуйте применить этот метод и сравните его эффективность с нейросетями. Зачем начинать холивары на пустом месте?
Я с вами однозначно согласен в одном. Самое правильное завершение спора — ещё две статьи.
1. С описанием математики
2. Сравнение
Отличная статья! Одназначно в избранное! Выходные предстоят занимательные)
Ура! Ну хоть кто-то присоединился ко мне в использовании лицензий Creative Commons на Хабре!

На счёт запрета коммерческого использования. Действительно ли вам нужен этот запрет? Ведь никто не сможет, например, перевести вашу статью на английский язык для какого-нибудь сайта с рекламой (но из-за SA ваше произведение и на английском языке осталось бы свободным). Вашу статью даже нельзя скопировать в ЖЖ, потому что там тоже висит реклама. В общем, посмотрите почему запрет коммерческого использования — это плохо и запрещайте только если вам это очень нужно.
Совершенно не понял что вы имели ввиду. Это вы свободные лицензии спамом назвали или ссылки, которые я привёл?
Спамом я называю одно из потенциально возможных применений моей программы.
Вы указали только лицензию на сам текст, в то время как читатель имеет право использовать полученную в результате чтения вашей статьи информацию в любых целях. Сам код вы раздаёте под GPL, так что спаммеры могут его спокойно использовать (соблюдая условия, конечно).

Статья мне очень понравилась. Поздравляю с победой!
Нормально ли писать, что лицензия распространяется на «текст, а также всю информацию, в нём содержащуюся»? А также изменять условия лицензирования после публикации статьи? :)
А как вы определите, что такая-то информация у меня в голове сформировалась именно только после прочтения вашей статьи?)
Изменять условия можно, вы же автор, но все те кто успел скопировать текст до этого, получается получили его на старых условиях.
Информация не защищается законодательством об авторском праве. Законодательством защищаются лишь произведения.

Увы, автор с этим ничего поделать не может. Пусть думает что хочет, но юридически он не прав.
UFO landed and left these words here
Да? Странно. Сайтом пользуюсь уже полгода, ни разу никакой рекламы не видел.
Меня посещают смутные подозрения. AdBlock?
Автор может делать со своим произведением всё что угодно и в том числе размещать на сайте с рекламой. Лицензия на автора не распространяется. Лицензия — это для других.
Ура! Ну хоть кто-то присоединился ко мне в использовании лицензий Creative Commons на Хабре!

У меня к вам прямой вопрос. Я туго разбираюсь в лицензиях, но давно хотел найти какую-нибудь свободную лицензию для текстов. Что-то типа LGPL или MIT. То есть близкая к полной свободе, но не «передача в публичное достояние». Типа, «за мной сохраняются авторские права, но можете делать со статьёй все, что угодно».

Что посоветуете?
Судя по таблице у MIT совсем нет копилефта, тогда вам подходит её аналог в мире контента — безкопилефтная Creative Commons Attribution (CC-BY). Она как бы говорит нам: «делайте всё что угодно, только указывайте моё авторство». Кстати, для России что общественное достояние, что CC-BY — фактически одинаковы, по закону всегда надо указывать автора (а вот в США для произведения в ОД можно не указывать).

LGPL имеет слабый копилефт. Больше свободных лицензий имеющих слабый копилефт я и таблица не знаем. Но нормальный копилефт имеет Creative Commons Attribution ShareAlike (CC-BY-SA).
А что у этой статьи была за лицензия раньше? Которая запрещает комерческое использование?
Спасибо за ликбез)
А я капчу красного оператора предварительно трансформировал по постоянному шаблону.
3D-капч я также преобразовывал к прямоугольному виду. Так распознавать было проще и процент ошибок заметно сокращался.
Это вы пересказываете собственный опыт или предлагаете правки к тексту статьи?
Но вы так и не ответили, зачем? Чему в них нравиться вообще? =\

Вы лишь заставляете читателя прерываться на определение адреса ссылки и отвлекаете его от главного.
Ну давайте разбираться, где же я отвлекаю этого бедного читателя.

Всего в тексте 5 ссылок на лурк. Из них три во вступлении, одна в заключении и одна — в самом начале текста про первую капчу. Таким образом, получается, что от технической части (в которой находятся все Глубокие Идеи (тм)) я читателя не отвлекаю вообще, и в то же время менее значимые части разбавляются этими самыми ссылками. Видите ли, я старался писать так, чтобы это читать было интересно.

Я ответил на Ваш вопрос?
Неа. И что интересного добавили эти ссылки? Их все желающие уже видели, лурк для хабра — не новость.

Лично мне после первых трёх вообще уже ни на какие ссылки смотреть не захотелось, но была бы там ценная информация — прочёл бы всё.
Если для Вас лурк — не новость, Вы должны быть прекрасно знакомы с тамошним стилем статей, где за невинными на первый взгляд заголовками ссылок часто скрывается неожиданное содержание. Причём чтение статей подразумевает, что вы наводите мышку на все ссылки подряд, но переходите лишь по единицам из них. Здесь я подразумевал то же самое — после первой же ссылки на лурк читатель должен был понять, что его ждёт в дальнейшем, и просто не переходить по ссылкам на вышеупомянутый сайт.

Режим Капитана отключён.
Вы и комментатор ниже меня немного не так поняли. Я действовал соответственно вашему плану:
1. навёл мышку на первую ссылку, увидел лурк;
2. навёл мышку на вторую ссылку, увидел лурк;
3. навёл мышку на третью ссылку, увидел лурк;
4. попытался понять зачем они там, не получилось;
5. решил до конца статьи на ссылки не отвлекаться вообще тк. опыт мне уже говорил, что там ничего нового не увижу.

Но всё же, зачем ссылки если вы планировали, что на них переходить не нужно? Это ещё менее логично. Честно, когда моя логика говорит «нет», то я таких вещей просто не понимаю. Хотя против статьи в целом ничего не имею, она — торт.
Странно. Я только что пересмотрел начало статьи и получил результаты, несколько отличающиеся от Ваших.

Ссылки по очереди:

Таким образом, Ваше высказывание выглядит, по меньшей мере, необоснованным.
Что за конкурс мне было не интересно, а про лицензию CC и ряд других вещей я уже читал. Отмаз сработал? :)
Вы же не могли не заметить, что текст ссылок не совпадает с названиями статей Lurkmore? Это просто тот же приём, как если писать в скобках «читай так-то», или перечёркивать более эмоциональный, но менее стилистически подходящий вариант. Помогает более точно выразиться. А наводить на ссылки — не такая уж сложная работа. Или вы с девайса с сенсорным экраном (тут ссылка на айпад) статью читали? ;)
Подсказка: при наведении мышки видно куда ссылка указывает, если лурк не нравиться — не переходите, из-за чего сыр бор?
Опа. Я эти ссылки банально не заметил при чтении. Разве что заинтересовался политикой лицензирования.

По теме ссылок — это плоский не смешной юмор. Конечно лучше, чем если все в сухом стиле преподносить. Но можно было бы и поинтереснее пошутить.
Любопытно, что многие капчаборцы используют нейронные сети для борьбы с поворотом изображений символов по сравнению с «эталоном».
Если сравнивать не обзбражение и эталон, а результаты применения к ним каких-либо преобразований нечувствительных к повроту — то результаты будут лучше а нейронные сети могут и не понадобится.

Беглое гугление по поводу преобразований нечувствительных к повороту выдаёт нам например слова «лог-полярное преобразование» + «вейвлет преобразование»
Любопытно, что в комментариях к любой толковой статье найдётся пачка теоретиков, знающих (понаслышке) 100500 методов, которые решили бы задачу в два счёта и со стопроцентной точностью.
Каким-либо обоснованием своих утверждений теоретики не утруждаются, ведь «беглое гугление» Гения куда значительнее, чем экспериментальные результаты черни…

Если Вы считаете, что «результаты будут лучше» — докажите, в противном случае это пустая болтовня.
за 5 минут получить 100% результат для любой капчи — не проблема.
Проблема только в том, что считать 5ю минутами, 100% результатом и любой капчей.
За статью спасибо, весьма познавательно. А насчет распознавания слипшихся символов (особенно в последнем случае) — первое, что мне пришло в голову, попробовать распознавать сразу пары или даже тройки. Конечно, возможных вариантов получится намного больше, но есть подозрение, что и качество заметно подрастет.
Возникает естественная проблема — а где брать образцы для обучения? Там алфавит на 22 символа, если хотим распознавать пары, понадобится, по крайней мере, 484 сегмента по 2 символа в каждом — в идеальном случае это 194 картинки, но идеальных случае в природе не бывает. Покажите мне человека, который добровольно согласится распознавать такое количество капч (китайских студентов и декапчер.ком не предлагать!). Я руками переименовывал все эти изображения, и, честно говоря, удовольствия мало. Это первое.

Второе — что-то я сомневаюсь, что при таком количестве различных образцов сеть сможет сделать вменяемое обобщение. Однако, проверке это утверждение не поддаётся из-за п.1.
Ну, для обучения можно нагенерить пары самостоятельно из одиночных символов — ведь примерный их вид известен. Думаю, должно прокатить. А вот со сложностью сети могут быть проблемы, это да. Но я бы попробовал.
подкинули бы пару идей о эффективной борьбе с авто-распознаванием
Для каждой из каптч, автор описал плюсы и минусы. Если сложить плюсы и убрать минусы, то получится почти идеальная капча )
Сделайте N наборов «порчи картинки» и накладывайте их случайным образом.
Из вышеперечисленного выделяется:
* разные цвета для букв
* разные аффинные преобразования для букв
* аффинные преобразования для всей строки
* 3d выпуклость
* пустые квадраты между буквами, буквами не являющиеся
* мусор
* переменное количество букв
* переменное направление чтения
* тестовый вопрос (введите каждую пятую букву на экране)

Идеальная капча должна выдавать строку подвергнувшуюся случайному набору преобразований. Так в один момент времени такая капча выдаст цветные буквы в 3d, в другой раз мусор и скривленную строку с вопросом и тп.
У них много различных вариантов генерации, но практически все распознаются проще простого.
> Идеальная капча должна выдавать строку подвергнувшуюся случайному набору преобразований.

И в результате будет у вас 10% капч которые распознаются с полпинка, потому что такие преобразования выпали. И этого будет более чем достаточно.
ага, если знать как распознавать конкретную капчу, есть много способов обдурить написаный кем-нибудь «детектор наложенных преобразований»
Показывайте не цифры/буквы, а фрукты-овощи, ну или фотографии знаменитостей :)
UFO landed and left these words here
Два чудища в масках скинхедов разрывают девушку с поднятыми руками пополам. Каков мой диагноз? :)
Годен. Вот если бы в вашем описании фигурировали хотя бы демоны и девственница, а также употреблялись слова «срущие» и «насилуют»… )
Ну монстры — это и есть демоны :D, а девственница ли девушка не известно, как и дальнейшие их действия.

Но я действительно сказал о том, что увидел на пятне :). И это меня беспокоит, хочу об этом поговорить :).
Черт, увидел то же самое. Там ещё сиськи торчат. А точка посередине — это бляха от пояса.
UFO landed and left these words here
Распознать текст тут не сложно, потому что он не искажен. А потом заправляем сюда.
UFO landed and left these words here
По-моему капча должна быть невыполнима для бота и не навязчива для человека (может так), не все же Онотолии в третьем поколении.

image
Для детекта ограниченного набора образов с неизвестными аффиными преобразоваиями лучше всего использовать сверточные нейронные сети (они фактически разбивают картинку на набор признаков и по ним детект уже гораздо эффективней)
Сначала прочитал эпитет насчёт нейросетей как «сверхточные», много думал…

Да, я хотел их использовать. Но, к сожалению, FANN их не поддерживает, адекватных альтернатив (в первую очередь, по скорости) я не нашёл, а писать что-то своё — слишком сложно и долго.

P.S.: если кто-то заинтересуется темой, то в интернете проще найти информацию по запросу «convolutional neural networks».
Раньше, что бы защитится от ботов использовал капчу, но она не спасает. Спасло знание олбанского и проверка по словарю. Только живой человек сможет понять фразу «Сем памножыть натры».
Пробовали reCAPTCHA? Насколько я знаю, одна из самых сложных на текущий момент.

Насчёт олбанского — уверен, хороший парсер и словарь сломят и такую защиту :)
При использовании reCAPTCHA боты пробивались только так, а при таком варианте защиты ботов почти нет, т.е. есть подозрение, что рекламных ботов все таки регистрируют в ручную, но их так мало, что можно сказать, что их нет.
Возможно, дело в том, что защита типа капчи слишком хорошо изучена, и для того, чтобы её пробить, используют негров бедных китайских студентов? В интернете же полно сайтов, предлагающих «вводить символы с картинок 1$/1000 шт.». То есть проблема не в устойчивости капч к распознаванию, а в людях, соглашающихся выполнять настолько бесполезную работу.
Проблема в том, что капчу с цифрами поймет даже бездушная машина, а высокослоговые предложения Русского языка поймет только НАШ человек )
Слышал, что в последнем Хрумере reCAPTCHA автоматически распознаётся.
UFO landed and left these words here
Вот что обидно — в конце статьи содержится Вопрос Жизни, Вселенной и проч., а ни один из комментариев даже не затронул эту тему. Неужели никто ничего не подскажет? :(
Могу предложить две мысли (оценки трудоемкости не с меня :))

Первая, с минимальным научным компонентом. Интеграция большинства сторонних обновлений в Windows Update. Уверен, это было бы полезно сотням миллионов. Не знаю, как монетизировать, правда, но должен быть способ :) И подходит ли это под нужные конкурсы.

Вторая. Экономический анализ мира.
Компании, Люди, Государства. Тратят и получают деньги. Производят и потребляют товары и услуги. Добывают сырье. Находятся в постоянных отношениях друг с другом. В Сети, и не только, есть множество информации, иногда прямой, иногда косвенной — объемы продаж, цены, оценки стоимости компаний, сделки, прогнозы, уровни добычи. Задача — построить модель, которая находилась бы в состоянии постоянного уточнения с новыми данными. И позволяла увидеть экономику мира, с возможностью zoom in/ zoom out. Дальше — прогнозирование :)
Реализация первой значительно осложняется тем печальным фактом, что у меня, к сожалению, нет доступа к внутренностям Windows Update. Даже если бы я сделал аналогичный сервис, кто даст гарантию, что меня послушает M$?

Вторую вы описали весьма расплывчато (по крайней мере, для меня), хотя, конечно, звучит захватывающе. Но вот первая же мысль в связи с реализацией — нужно собирать статистику по интернету -> нужно аккуратно парсить содержимое статей по этой теме -> нужно понимать это содержимое -> нужно пройти тест Тьюринга :(
В зависимости от страны, в которой вы находитесь, могут быть юридически чистые способы получения доступа к внутренностям на клиенте. Сервер, конечно, понадобится свой :)

Вторая — реализация точно не будет простой :)
Спасибо за статью, отлично написано. Вот вопрос возник по последней капче, там где цифры загораживали соседей. Нельзя ли на вход нейронной сети подавать +1, где чёрный пиксель, -1, где белый, и 0, где серый (иными словами, где он загорожен соседней цифрой)? Может ли нейронная сеть воспринимать среднее нейтральное значение как «неизвестность» и принимать решение на основе только тех пикселей, которые ей известны?
Да, я это раньше читал. Попутно подумал, что новую «святую» капчу я смогу распознать где-то на уровне 30-40%, ибо свято верю в мощь нейросетей, а препроцесс и сегментация там весьма тривиальны. Впрочем, печально, конечно, что администрация позволяет себе такое.
Спасибо, статья интересная и легко читается.
Автор, а вы не хотите поучаствовать в Инетрнет-Математике 2011? Там вроде как раз про работу с изображениями в этом году.
Первый раз слышу об этом конкурсе.

Думаю, нет. До дедлайна два месяца, а дел по горло, тем более что придётся разбираться в новой для себя теме. Не успею.
Идеальная капча блаблабла, пока есть индусы, любая капча обходится в такие копейки, что спам будет процветать. Я вообще удивлен, что многие монстры индустрии до сих пор пытаются капчами что-то закрывать. Эта защита устарела лет на десять.
Если нет под рукой Wolfram Mathematica, с матан-капчами они повозятся =)
Бррр, куда они повозятся? Если человек не в состоянии распознать капчу без дополнительных средств, то зачем такая капча?

А я понял, вы не так поняли мое упоминание об индусах :)
Ага, я именно про этих монстров индустрии и говорю, хотя в свое время мы легко сотнями регистрировали аккаунты на gmail обходя капчу именно дешевыми человеческими ресурсами, а не сложными и громоздкими система на основе нейронных сетей и прочего.

Задача капчи по сути — сделать автоматическую регистрацию аккаунтов в системе дорогой. То есть чтобы потенциальный «спамер» не делал сотни аккаунтов легких нажатием кнопки или делал бы, но для этого ему бы пришлось создать ПО, которое было бы настолько дорогостоящим, что затраты на него не окупались бы прибылью полученной с этих аккаунтов. При этом основная проблема капчи — она еще и человеком должна нормально распознаваться, не напрягая его.

Так вот основная проблема в том, что эта система легко обходится человеком и до тех пор, пока есть индусы, капча защищает лишь от школоты, которая решила нарегать себе кучу аккаунтов примитивными программками. Профессионалы давно решили эту проблему человеческим фактором и использование капчи в качестве защиты давно устарело.

Это не пришлось бы объяснять людям, которым хоть раз понадобилось бы зарегистрировать в какой-либо системе с капчами больше сотни аккаунтов. Основная проблема современных систем защиты в том числе и у монстров индустрии состоит в том, что у них на работу приняты крутые спецы по защите, которые никогда не работали по другую сторону. Они борются с проблемой, которая им кажется, а не с той, которая есть на самом деле.
Да, а на тему альтернативного мнения, миллионов, которые не могут ошибаться и блаблабла, именно благодаря этому деньги в мире делятся 80/20, а не наоборот :) Пока ставятся защиты типа капчи, спамеры будут грести миллионы лопатами :)
Господа, «взламывающие» капчи. Вам сей мессадж.

Капча — это штука позволяющая отсеивать низкопрофессиональных спаммеров. Это первая линия обороны от спама на ваш сотовый телефон, ваш форум, в вашу гостевую. К сожалению она не совершенна, и совершенной быть не может. Но ничего лучше пока не придумали.

Поэтому помните, что выкладывая в паблик вот такие статьи с исходниками вы делаете ровно одну вещь — уменьшаете входной порог для всевозможных спамеров. Думаю это единственные люди, которые скажут вам спасибо.
У оператора green вторая линия точно есть. Насчет остальных не знаю.
С таким подходом вообще треть интернета можно снимать с публикации ;)
Капча — это морально устаревшая защита, мешающая нормальным людям. Меня вот вымораживают капчи с разными оттенками, как человека, не различающего некоторые оттенки зеленого, для меня это катастрофа. Я встречал сайты, где не регался по причине того, что с трех раз не смог правильно ввести капчу и т.д. Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно. Но чтобы их придумать и понять надо сначала попробовать поработать с другой стороны.

А эта статья интересна не с точки зрения капч, а с точки зрения распознавания символов, мне вот таких статей не хватало в институте на занятиях по нейронным сетям. А с точки зрения информационной безопасности — статья не несет серьезной смысловой нагрузки.
Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно.

Не будьте голословными. Объясните хотя бы в общих чертах, что вы имеете в виду.

А с точки зрения информационной безопасности — статья не несет серьезной смысловой нагрузки.

Предлагаете перенести в другой блог?
UFO landed and left these words here
Уговорили. Перенесу по истечении 24 часов с момента публикации.
Насчет неголословности обязательно объясню, но чуть попозже, когда у себя на сайте оттестируем защиту и убедимся в достаточной эффективности, чтобы действительно не быть голословными. С другой стороны в паблике это точно не будет выкладываться, потому что до появлени в паблике это будет как раз эффективной защитой :)

вот ниже правильно предложили в обработку изображений. я бы там такую статью скорее стал искать.
> Есть намного более интересные и серьезные варианты защиты, которые не избавят от спама целиком и полностью, но сделают его настолько дорогим, что встанет вопрос а надо ли оно.

Поделитесь информацией. Спасёте интернет от капчи.

Ага или помогу спамерам в очередной раз модернизировать свой софт :) Не для паблика и после тестов.
Ну вот, слишком поздно кинул в паблик:(
Но в любом случае можно декомпильнуть и посмотреть что-как.
Да ладно, судя по скрину, в старой капче ничего сложного не было :)
Кстати, по-моему, новая тоже сложная только для человека, компьютер с ней легко разберётся.
хорошая работа.

я не буду писать про то, что распознавать капчу автоматическими методами нерентабельно уже года 3:)
В таком случае воспринимайте статью просто как описание подхода к распознаванию символов.
Скажите, я правильно понял, что в каждом случае во втором слое вы использовали ровно три нейрона?
Нет. Просто иллюстрация неудачная :)

Я экспериментировал с различным количеством нейронов во втором слое, и остановился на одной трети от числа нейронов первого слоя.
При условии, что на вход подавалась ч/б картинка 30 x 30? Ее никак перед этим не изменяли (усреднение цвета по соседним пикселям и тп)?
Вообще-то, статья как раз и посвящена тому, что делается с этой картинкой до передачи её в нейросеть. В статье были примеры изображений перед самой передачей:

image
Уважаемый минусатор. Скажите, вы испытываете какое-то особое удовольствие от того, что у всех моих последних комментариев ровно по одному минусу?
Задача была именно написать программу распознавания, а не спамить.
Буду очень благодарен, если кто-нибудь объяснит, как это запустить.Перепробовал штуки 3 разных версий питона, ещё 3 разных opencv, но запустить не смог.Желателен ответ в духе «поставить такую-то версию питона, такую-то openc, скопировать то-то туда-то, затем там-то нажать такую-то кнопку».
Всё писалось под Python 2.6.6, OpenCV 2.1, FANN 2.1.0beta. Но установка OpenCV и FANN — это весьма трудоёмкий процесс, и 2 года спустя я уже не смогу описать вам все детали. Впрочем, что касается FANN: где-то в интернете я видел хорошую инструкцию по его установке под Linux, попробуйте погуглить.
Only those users with full accounts are able to leave comments. Log in, please.