Comments 29
несколько дней назад я осилил запуск питона и решил
что можно решать их банальным сравнением с маской, что и подтвердилось впоследствии.
Я понимаю этот энтузиазм, но мне кажется что этот восторг не стоит статьи на хабр.
Банальное сравнение по маске объекта на "зашумленном" изображении да еще при таких граничных условиях, не стоит статьи (и тем более публикации этих "26 строчек кода на питоне").
Я поделился не восторгом, а простым решением одной конкретной небольшой проблемы. Полагаете, лучше на пикабу? Или оно вообще никому не интересно?
Извините, но эта задачка настолько банальна (OCR алгоритмы).
Я догадываюсь, что, наверное, это сейчас уже не преподают или Вы это не проходили.
Изобрести велосипед в самом древнем варианте (деревянные колеса и отталкивание ногами) — это наверное здорово (если никогда велосипедов не видел раньше).
Возможно я слишком жестко написал о своем впечатлении от статьи.
Но, для наглядности, что бы понять причину моего комментария.
Для иллюстрации замените
"Капча, частный случай: рвём нейронную сеть тридцатью строками кода"
на, например,
"Сортировка, частный случай: рвём нейронную сеть тридцатью строками кода".
"Сортировка" в котором узнаете частный случай (например только байтов с ограничением размера массива) сортировки "пузырьком".
Мысль, которая мне понравилась в статье: не надо пихать везде нейронные сети.
А вот изобретение велосипеда — не очень понравилось. Все же OCR алгоритмы это не ново.
Но почему бы не поделиться решением проблемы, пусть и очень специфической.
Для иллюстрации замените
Заменил. Но тогда надо пойти до конца, и представить что перед этим на хабре была статья "Как отсортировать: нейросеть на Tensorflow,Keras,python v неотсортированный список". И сразу предложенная статья начинает казаться уместной, и даже необходимой.
Я понимаю этот энтузиазм, но мне кажется что этот восторг не стоит статьи на хабр
Ну почему же. Любой опыт, проведенный своими руками интересен, если его результаты не совсем уж очевидны. Мне было интересно.
13 февраля 2010 года на хабре появилась статья «Первый опыт создания нейронной сети. Хабракапча», на нее уже ответили чуть больше 30 человек, пост вылез на глагне, как автор наслушавшись, что произошло с прошлыми героями, зас*ал и удалил статью.
Лурк
Увидел, что в комментариях кто-то критикует вашу цель написания статьи. Не совсем соглашусь с ними, ибо даже эти самые радости и восторг от того, что код работает мотивируют программистов не бросать своё дело. Сам занимаюсь питоном полтора года, но до сих пор не пробовал сам написать нейронку (страх).
Отдельно доставило потом обнаружить, как кто-то не поленился мой код изучить и выложить в виде туториала (даже в закладки сохранил).
1. при открытии страниц с информацией об объектах недвижимости разворачивать сведения о правах;
2. собирать информацию с этих страниц для последующей обработки.
Мне стыдно, что написал про капчу так, что сложно оказалось повторить и вы сделали такой круг.
Странно, что из 29000 капч столько дублей, но это я собирал seleniumoм, потому что requestы приводили к банам.
Надо потестить ваше решение, его краткость подкупает!
p.s. у меня висит решение по гугл-капче в черновиках, но публиковаться вряд ли будет, т.к. это откроет ящик Пандоры для спамеров разного рода. Могу с вами поделиться. Росреестр заметно хуже стал работать после того, как «нашли решение с капчей».
Гуглокапча пока не вызывает боли, я её вижу раз в год, так что пусть она лежит в тайне от спамеров.
Росреестр, мне кажется, сам по себе помирает — там, по-моему, системные проблемы. У них на сайте есть ещё один вид капчи, пугающий своей сложностью; елси бы они хоткли, уже давно бы её включили.
С начала опреля 2020 они решили, что мы за свои деньги не можем заказывать выписки чаще, чем одна выписка за пять минут.
А перепоручим-ка мы это дело боту.
После запуска скрипта открывается окно Хрома. Авторизуемся. вставляем сколько нужно кадастровых номеров в форму поиска, дожидаемся списка объектов для заказа выписок. Далее в консоли набираем GetAll() и созерцаем процесс.
В случае ошибок копируем из консоли обработанные КН и удаляем их из исходного списка.
Повторяем: копируем список КН в форму поиска, GetAll() и т.д. Ошибки возникают крайне редко (раз в пять минут, ха-ха). В целом, 2-3 десятка выписок без ежиного разрыва — вполне обычно.
Капча, частный случай: рвём нейронную сеть тридцатью строками кода