zoldaten 20 авг 2019 в 18:14

Как обойти капчу: нейросеть на Tensorflow,Keras,python v числовая зашумленная капча

7 мин

44K

Python*Машинное обучение*Искусственный интеллект

Туториал

+15

Комментарии 25

Neusser 20 авг 2019 в 18:23

Предварительно создать папки C:\1\test и C:\1\test-out

Уж пару строк-то в скрипт можно было бы добавить, чтобы он создавал…

TheGodfather 20 авг 2019 в 19:02

Распознавание капчи длится 28 сек на компьютере средней мощности. 2 сек можно выиграть благодаря применению в скрипте многопоточности, но это, как говорится, что мертвому припарка.

Распознавание 30 сек??? Капчи??? Вроде нынче автомобильные номера в реалтайме распознаются, а у вас капча 30 секунд?

Groramar 20 авг 2019 в 20:05

питон же :) да и без gpu, но всё равно как-то вяло.

-4

TheGodfather 20 авг 2019 в 22:07

в смысле питон? Мне всегда казалось, что подобные штуки типа TensorFlow или там MKL — у них из питона только bindings, а основной код все равно C/C++. Или тут само распознавание и нейронка на чистом питоне? ОМФГ тогда, я не понимаю, куда катится мир.

Celsius 20 авг 2019 в 21:57

Скорее всего, основное время занимает инициализация TF, при первом запуске библиотека всегда долго раскочегаривается.
В горячем режиме, с загруженной моделью, результат выдается моментально.

zoldaten 21 авг 2019 в 09:25

Пока это лучший результат с «прогретым» TF на слабом железе без CUDA. Опять же надо учитывать, что по факту распознается 5-ть разных цифр отдельно, т.е. на 1 цифру приходится по 3,52 сек.

midvikus 21 авг 2019 в 10:29

def prescript(file):
    cmdCommand = "python predict-captcha.py --image "+ file +" --model simple_nn.model --label-bin simple_nn_lb.pickle --flatten 1"
    process = subprocess.Popen(cmdCommand.split(), stdout=subprocess.PIPE)
    output, error = process.communicate()
    print (str(output)[2])

1. Тут скорее дело в том, что вы для распознавания каждой картинки вызываете скрипт predict-captcha.py и таким образом каждый раз заново загружаете модель, хотя достаточно это сделать один раз.
2. Не понятно зачем вообще вызывать это как скрипт, когда можно оформить как модуль и импортировать.
3. Предыдущий пункт заодно позволит не сохранять картинки на диск, а использовать питоновские file-like объекты.
4. Не понятно почему не использовалась сверточная архитектура, хотя она лучше подходит для распознавания изображений.
5. И даже ваш подход можно попробовать улучшить если использовать transfer learning.

zoldaten 21 авг 2019 в 11:33

1,2.Да это колхоз, через subprocess, именно он все тормозит. Временная «изолента».
3. Вы про pickle.dumps?
4.Вы правы. Но интерес был выжать из простой сети максимум.
5.Каким образом это реализуется?

-2

midvikus 21 авг 2019 в 11:45

Про file-like я например про BytesIO.
Про transfer learning — мелькнула мысль, что если предварительно обучить на MNIST, а потом заморозить нижние слои, кроме предпоследнего и обучить уже на капчах. Вот, например, тут правда CNN.

А колхоз убрать не долго и тогда смысл в замерах хоть какой-то появится.

zoldaten 21 авг 2019 в 12:45

Одну грыжу вправил с subprocessами:

midvikus 21 авг 2019 в 12:58

Ну вот, уже лучше) Еще бы код увидеть. На github было бы намного удобней. И статью обновить не забудьте)

zoldaten 21 авг 2019 в 13:22

C BytesIO скорее всего не выйдет, т.к. изображение необходимо сначала открыть в rb режиме. В коде капча считывается в стандартном режиме, иначе ее потом не нарезать.
Такой вариант дает ошибку:
f = open(«img1», «rb»)

midvikus 21 авг 2019 в 13:50

Сохраняем в буффер:

import io
from PIL import Image
img = Image.open('capcha.jpg')
area1=(27,0,51,37)
img1 = img.crop(area1)
buffered_img1 = io.BytesIO()
img1.save(buffered_img1)

Передаем в функцию и читаем из буффера:

import cv2
import numpy as np
img1 = cv2.imdecode(np.fromstring(buffered_img1.read(), np.uint8), 1)

Только проще сразу img1 передать))

zoldaten 21 авг 2019 в 15:09

Спасибо за поддержку, но нет.
Переписал парсер, чтобы он вместо image.jpg принимал из буфера, но там дальше по коду идет resize img и построение массива из картинки. Вообщем, по нарастающей.
Если есть желание, можете покрутить.

YuraLia 21 авг 2019 в 11:52

Баловался подобной задачкой, на компе средней мощности (без GPU) почти мгновенно сетка распознавала, за секунды, или может доли секунд, даже не замечал лага особо никогда. Причем капча была посложнее, с шумами/дисторсией/поворотами. Сеть имела десятки слоев чтобы уверенно распознавать, архитектура типа resnet.
Может дело в том что в моей версии tensorflow-cpu использовались AVX-инструкции?

egor_masalitin 20 авг 2019 в 20:11

Have you heard about github?

Xobotun 20 авг 2019 в 20:46

М-м-м. Мне кажется, что большей точности можно было бы добиться, заменив простейший "нож" по геометрическим координатам на хоть какой-то классификатор, который позволил бы избежать проблемы как тут:
Картинка с куском цифры 3 слева и цифры 8 справа, распознано 7
Когда на одной картинке две половины двух разных цифр.

zoldaten 20 авг 2019 в 21:59

В этом-то и фикус, что сеть учится на захламленных капчах. Ниже та же картинка, но уже распознанная сетью.

-1

НЛО прилетело и опубликовало эту надпись здесь

zoldaten 21 авг 2019 в 15:17

1.Зачем нужен генератор капч, если их и так более чем достаточно — 29 000?
2. Как вы видите обучение без разметки датасета?
3. 4 секунд в данном случае вполне достаточно, точность 90% и это еще не CNN.

-2

SandroSmith 21 авг 2019 в 15:30

2. Имелось ввиду, что если мы сами создаём капчи, то они уже размечены.

zoldaten 21 авг 2019 в 15:37

Звучит заманчиво, но, боюсь, это не наш случай.

-2

gofat 21 авг 2019 в 11:33

Можно заморозить получившийся граф, выгрузив его из keras'а и использовать tensorflow-serving: github.com/tensorflow/serving
Через serving должно побыстрее заработать.

zoldaten 21 авг 2019 в 12:43

maximax 21 авг 2019 в 13:14

Какая знакомая капча из онлайн-сервиса Росреестра ;))

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Как обойти капчу: нейросеть на Tensorflow,Keras,python v числовая зашумленная капча

Комментарии 25

Публикации

Истории