Damaskus Jul 4 2011 at 20:41

Система учета на базе OCR системы

5 min

7.5K

Image processing*

From sandbox

+17

Comments 15

skynoname Jul 5 2011 at 17:57

А сделайте какой-нибудь perfomance_test.cpp для сравнения со стандартными алгоритмами из OpenCV, было бы интересно посмотреть, что там с быстродействием и точностью обработки на тестовом наборе данных

Damaskus Jul 5 2011 at 22:02

Сравнить быстродействия двух алгоритмов будет достаточно сложно, так как в имеющемся решении присутствуют операции записи\чтения из файла. Если реализовывать решение полностью на C++ с использованием OpenCV, то это решение будет скорее всего быстрее за счет экономии времени на этих операциях.
Единственный момент — создание базы изображений, тут tesseract мне показался более удобен.

zen Jul 5 2011 at 17:59

«не горизонтально вертикальные границы» :)

Damaskus Jul 5 2011 at 22:06

Да, не совсем корректно выразился :)
Не горизонтальные и вертикальные границы. На первой вырезке как раз такая картинка.

ChemAli Jul 5 2011 at 18:03

А кто фотографировал щиты и каким образом? Просто если это делалось вручную, то какой смысл в автоматическом распознавании?

Damaskus Jul 5 2011 at 22:13

Совершенно справедливый вопрос. Разработка средства доставки изображения — следующая задача.
Вариантов множество: MMS, E-mail или некое собственное приложение, в котором будут жестко зашиты координаты сервера, чтоб персонал лишний раз не думал.

UFO just landed and posted this here

Damaskus Jul 6 2011 at 06:27

Смысл как раз в том, чтобы человек в этом участвовал минимально и правильность установки проверялась автоматически. А цифры, в отличии от тех же самых QR кодов, как раз позволят проверять и в ручном режиме.

ChemAli Jul 6 2011 at 08:55

Трудно назвать минимальным участием случай, когда человек ездит от щита к щиту и фотографирует их. Имхо, автоматизировать следовало как раз это звено.

tyratam Jul 5 2011 at 18:08

В питере подобную систему запускали еще пару лет назад.
Агенты объезжали рекламные щиты и снимали их наладониками с GPS, по инету фотка отправлялась на центральный сервер вместе с координатами.
В центре картинка распознавалась путем сравнения с «эталонном» (без всяких дополнительных цифр).
На основании рекламных контрактов (они все были в базе) принималось решение о том, «правильная» висит реклама или чужая (просроченная).
Так как на система автоматически выписывала «штрафы» обслуживающим организациям, начальника подразделения разработавшего и внедрившего все это через несколько месяцев «убрали с повышением»

Damaskus Jul 5 2011 at 22:23

Решение красивое, но обладает требованием по наличию GPS.
Здесь же задача привязки к местности решается за счет сопоставления 2-х номеров.
Еще одна проблема заключается в том, что для разных щитов полиграфия может отличаться незначительно и при не самом удачном снимке и плохой камере можно получить ошибку.
С контрольной суммой же, вероятность ошибиться ничтожна: либо есть, либо нет.

tyratam Jul 6 2011 at 13:56

GPS — это не сложно ;)
А по поводу влияния полиграфии на качество распознавания, так для этого и есть такая дисциплина — распознавание образов. Изучение которой и позволило создать систему.

TsarS Jul 5 2011 at 18:15

А QR кодами не проще было бы? =)

Damaskus Jul 5 2011 at 22:32

Такой вариант рассматривался, однако у него есть свои недостатки.
Если посмотреть на последнее фото, его размер 320 на 240, сделан он на древний Sony Erricson.
Неизвестно как выглядел бы QR код после сжатия в jpeg на этом фото.
Изначально информация в арабских цифрах обладает большей избыточностью и помехоустойчивостью.

SKolotienko Jul 6 2011 at 16:59

Вы недооцениваете QR Code и его помехоустойчивость, а также то, с какими дефектами справляются распознающие алгоритмы. На той же площади, которую занимает текст (и который довольно часто распознаётся с ошибками), можно разместить QR код с большей информацией и защитой от дефектов.

Show the best of all time