Как стать автором
Обновить

Комментарии 21

Простите, но первая картинка вырвиглазна.
Уменьшил её более чем на 20 процентов, теперь она не режет так глаза.
Как ты умудряешься быть первым в который раз? O_o
F5-Джедай
Движок Tesseract OCR был одним из лучших 3 двигателей в 1995 году на UNLV Accuracy test. В период между 1995 и 2006 годах он был немного доработан, но это, вероятно, один из наиболее точных OCR движков доступный с открытым исходным. Исходный код будет читать бинарные, серые или цветное изображение и выводить текст.

Местами читать очень тяжело, например, как в приведенном примере.
Спасибо за критику, выделенный кусок текста — это описание, которое я взял с сайта и перевёл, поэтому получилось не очень красиво, теперь как мне кажется стало лучше.
Статья в помощь спамерам.
Не поверите, но на днях игрался с этой библиотекой и тоже хотел написать статью:)
Мне удалось распознать капчи двух крупнейших сотовых операторов и суверенного лепрозория. Занимался этим для саморазвития, даже не знаю, что теперь с этими наработками делать… спамерам отдавать не хочу.
Отдайте админам крупнейших сотовых операторов и суверенного лепрозория. Им пригодится.
ога, и новую капчу, которую после этого поставят не разгадает даже человек)
Меня убивают некоторые капчи из статьи. Такое ощущение что авторы специально старались усложнить жизнь не спамерам, а обычным пользователям. Ставить оранжевые чифры на красном фоне, учитывая то, что машине абсолютно пофиг как сильно в этом случае различаются цвета фона и шрифта — верх глупости.
Друзья, что насчет кириллицы?
Но похоже, это для третьей версии :(
Для второй нет.
Как показал мой личный опыт, третий тессеракт работает с кириллицей довольно скверно. У меня результаты получились хуже, чем на cuneiform.
Небольшая ложка дегтя:
«Tesseract C++ source code is full of memory leak. Using tessnet2 assembly several time will cause memory overflow. This is not tessnet2 leak, this is tesseract leak and I spent two days in tesseract source code trying to improve this with no success. See what I think about this
Шикарно, использовал tessnet2 для License plate recognition. Но были проблемы с нахождением номера на фото, а также если сфотографирован под углом…
Автор подобным не занимался?
Хороший пример реального приложения, но, к сожалению подобных задач я ещё не встречал в своей работе, думаю ещё все впереди.
А вы случайно не заморачивались подготовкой этой библиотеки для распознавания какого-нибудь особенного шрифта? Просто я столкнулся с пробемой, что абсолютно читаемые человеческому глазу черные цифры на белом фоне очень криво распознаются этой библиотекой. А так как распознавать надо только цифры, хочется прям чуть ли не задать ей все картинки цифр вручную. Как лучше это сделать?
Пробовал по инструкции code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3, но что-то очень тяжело все для меня…
Уже нашел и обучалку под .Net, и отличную программу VietOCR, которая позволяет проверить подготовленные по шрифту данные. Ну и чтобы их потом использовать, нужно было просто подобрать работающую библиотечку. Кстати, можно ее взять и из той же программы.
Но в конечном итоге я столкнулся с ситуацией, что несмотря на все обучение и качественную пред-обработку, программа иногда отказывалась распознавать число без указания рамки… В общем, вернулся на старую tesseract2, она работает с дефолтным языком даже стабильнее, чем новая почему-то.
А еще позже я выяснил (это есть в комментарии выше), что эти библиотеки страдают утечками памяти.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.