Pull to refresh

Comments 15

А сделайте какой-нибудь perfomance_test.cpp для сравнения со стандартными алгоритмами из OpenCV, было бы интересно посмотреть, что там с быстродействием и точностью обработки на тестовом наборе данных
Сравнить быстродействия двух алгоритмов будет достаточно сложно, так как в имеющемся решении присутствуют операции записи\чтения из файла. Если реализовывать решение полностью на C++ с использованием OpenCV, то это решение будет скорее всего быстрее за счет экономии времени на этих операциях.
Единственный момент — создание базы изображений, тут tesseract мне показался более удобен.
«не горизонтально вертикальные границы» :)
Да, не совсем корректно выразился :)
Не горизонтальные и вертикальные границы. На первой вырезке как раз такая картинка.
А кто фотографировал щиты и каким образом? Просто если это делалось вручную, то какой смысл в автоматическом распознавании?
Совершенно справедливый вопрос. Разработка средства доставки изображения — следующая задача.
Вариантов множество: MMS, E-mail или некое собственное приложение, в котором будут жестко зашиты координаты сервера, чтоб персонал лишний раз не думал.
Так а смысл-то какой? Зачем делать распознавание, если цифры сразу могут быть прочтены человеком?
Смысл как раз в том, чтобы человек в этом участвовал минимально и правильность установки проверялась автоматически. А цифры, в отличии от тех же самых QR кодов, как раз позволят проверять и в ручном режиме.
Трудно назвать минимальным участием случай, когда человек ездит от щита к щиту и фотографирует их. Имхо, автоматизировать следовало как раз это звено.
В питере подобную систему запускали еще пару лет назад.
Агенты объезжали рекламные щиты и снимали их наладониками с GPS, по инету фотка отправлялась на центральный сервер вместе с координатами.
В центре картинка распознавалась путем сравнения с «эталонном» (без всяких дополнительных цифр).
На основании рекламных контрактов (они все были в базе) принималось решение о том, «правильная» висит реклама или чужая (просроченная).
Так как на система автоматически выписывала «штрафы» обслуживающим организациям, начальника подразделения разработавшего и внедрившего все это через несколько месяцев «убрали с повышением»
Решение красивое, но обладает требованием по наличию GPS.
Здесь же задача привязки к местности решается за счет сопоставления 2-х номеров.
Еще одна проблема заключается в том, что для разных щитов полиграфия может отличаться незначительно и при не самом удачном снимке и плохой камере можно получить ошибку.
С контрольной суммой же, вероятность ошибиться ничтожна: либо есть, либо нет.
GPS — это не сложно ;)
А по поводу влияния полиграфии на качество распознавания, так для этого и есть такая дисциплина — распознавание образов. Изучение которой и позволило создать систему.
Такой вариант рассматривался, однако у него есть свои недостатки.
Если посмотреть на последнее фото, его размер 320 на 240, сделан он на древний Sony Erricson.
Неизвестно как выглядел бы QR код после сжатия в jpeg на этом фото.
Изначально информация в арабских цифрах обладает большей избыточностью и помехоустойчивостью.
Вы недооцениваете QR Code и его помехоустойчивость, а также то, с какими дефектами справляются распознающие алгоритмы. На той же площади, которую занимает текст (и который довольно часто распознаётся с ошибками), можно разместить QR код с большей информацией и защитой от дефектов.
Only those users with full accounts are able to leave comments. Log in, please.