Как стать автором
Обновить

Сколько нужно программистов и прописей, чтобы распознать рукописный паспорт?

Время на прочтение4 мин
Количество просмотров7.7K
Всего голосов 20: ↑20 и ↓0+20
Комментарии36

Комментарии 36

Откуда они берутся? Ну паспорта эти, вручную заполненные.

Не везде принтеры были?
Он же в РФ бессрочный с 45 лет, да и с 20 тоже долго «живёт».

НЛО прилетело и опубликовало эту надпись здесь
Из паспортных столов мелких городков начала 2000-х.
Обязательная замена паспорта гражданина РФ проводится по достижении 20 и 45 лет, то есть россияне могут пользоваться паспортами, выданными и 10, и 20 лет назад. Понятно, что сейчас такие паспорта выдаются скорее как исключение — например, в случае ЧС или сбоя в системе выпуска (принтер сломался), страна у нас большая и замена/ремонт может занять время, а паспорт человеку выдать лучше прямо сейчас.
Из паспортных столов берутся :). У меня, например, до сих пор такой.

Спасибо за статью!


Интересует мобильный SDK для распознавания документов. Можете сориентировать по ценам (хотя бы примерно) и условиям лицензирования (в месяц / за приложение / за объем)?

Добрый день, обратитесь пожалуйста в нашу службу продаж по почте или через заявку на сайте, они проконсультируют.

Нда, пообщался я с вашими продажниками. Если они не могут даже порядок цен и условия лицензирования сообщить без того, чтобы я им предварительно доложил, кто я, из какой компании, зачем мне этот SDK нужен, и написал с корпоративного ящика, то продолжать общение как-то не очень хочется.

Та оно как на рынке в туристической зоне — цена зависит от внешнего вида, цвета кожи, акцента и прочих параметров покупателя.

Здесь, вне зависимости от мнения уважаемого сообщества Хабра, мы вынуждены строго обозначить свою позицию. Физическим лицам мы софт не продаем, только компаниям. Коммерческие условия мы раскрываем только тем компаниям, у которых есть намерение купить. Если автор запроса не сообщает ни компанию, которую он представляет, ни цели использования нашего SDK, то это свидетельствует о том, что покупать софт он не намерен.

Выводы об авторе запроса вы делаете интересные, но неправильные.


В моем случае это означает, что я еще не определился, хочу ли я покупать софт именно у вас. И поскольку эта функциональность для нас в настоящее время не основная, то решающим фактором становится цена. Одно дело, если софт обойдется, скажем, в 100 евро в месяц, другое дело – если в 1000. В последнем случае бюджет мне на него никто не одобрит, каким бы этот софт замечательным ни был, пусть он хоть в перерывах между сканированием документов варит кофе и рассказывает анекдоты.


Цель использования я кстати написал в переписке с вашими сотрудниками (аж сам директор по специальным проектам ответил, приятно).


А название компании выпытывать – это, знаете ли, так себе. Я как бы и не скрываю, где я работаю, но если я прихожу в магазин, а мне говорят: "Не хотите назвать свое имя, и зачем вам наш пылесос? Ну это свидетельствует о том, что покупать его вы не намерены. Не продадим и цену на него не скажем" – то мне хочется побыстрее из этого магазина уйти.

В статье не говорится о проценте ошибок при работе системы.
Представьте, если система работает в аэропорту и из-за ошибки человек не смог улететь своим рейсом. Здесь как с беспилотными автомобилями, либо работает на 100%, либо это выльется в большие проблемы.
Насколько я понял — все равно процесс распознавания не автоматический, а автоматизированный, т.е. окончательную сверку проводит человек (для него просто облегчение в виде не полного набивания полей, а только корректировка некоторых «букофф»?
Все зависит от процесса, если процесс требует максимально возможного качества то связка программа + человек работает, но накладывает требования на программу детектировать свои ошибки с разумным качеством (ошибки 1-го и 2-го рода). Кроме того, не надо забывать, что человек тоже ошибается, особенно в конце рабочего дня. К сожалению человек может ошибаться специально и иногда выходит вообще лучше исключить человека, такие случаи у нас есть. Для рукописи мы ввели специальный дополнительный сигнал — это рукопись, это помогает уменьшить число ошибок.

В аэропорту по внутреннему паспорту в РФ летают?
Или заграны от руки пишут?

Внутри страны летают по внутреннему, а на заграничных есть специальный код (со стрелочками такой), который можно сканировать, еще и чип внутри. А, ну и у заграна срок действия меньше — там все паспорта в обороте напечатанные.
Успехов, ребята. Проделали большую работу, нелегко рукописный текст даже человеку бывает понять.
Скажем так, решение задачи ребятам сильно облегчил ограниченный набор данных, требующих распознавания, и, в целом, ОТНОСИТЕЛЬНО ХОРОШИЙ ПОЧЕРК ЛИЦ, ЗАПОЛНЯЮЩИХ ПАСПОРТА ВРУЧНУЮ, т.е. можно сказать, что вместо реального 5-го приближения, как говорят физики, проблема решена в нулевом…

Серьёзно оценивать практическую годность технологии, наверное, можно было бы по выборке из х00-х000 студенческих конспектов по разным предметам, различных анкет, где шрифт налагается на надписи самой анкеты и т.п…

Но ведь статья о распознавании рукописного ПАСПОРТА… И об этом (о сужении задачи и об аккуратности почерка) в явном виде говорится во втором абзаце статьи. Как студенческие конспекты относятся к «серьезной оценке практической годности» технологии распознавания рукописного паспорта?
Распознавание рукописных паспортов — это частный случай задачи распознавания рукописного текста. Найдя частное решение проблемы, для математиков и физиков вполне естественно искать общее решение
Тут я с вами совершенно согласен — очень интересно дальнейшее решение задачи в более общем случае. И наверняка можно обобщить и задачу распознавания рукописного текста на какую-то более общую, и так далее.

Меня лишь смутил ваш комментарий про оценку практической годности. С моей точки зрения практическая оценка технологии должна проводиться не по общности применения, а как раз наоборот — по применимости к конкретному целевому объекту, адекватном понимании особенностей конкретной задачи и их учете. Иначе получается (может не очень хорошая аналогия, но все же), что очки на минус 3 это плохое технологическое решение, потому что не подходят для людей, у которых зрение минус 5, и серьезно для практического использования можно будет рассматривать только очки, подходящие всем сразу…
Что касается практической годности — тут тоже есть большие сомнения. С рукописными паспортами не сталкивался лет 20, если не 25.
Поскольку деньги бюджетные — считаю проще было бы потерпеть до замены последних рукописных паспортов, если речь не идёт о какой то региональной аномалии.
А причем тут бюджетные деньги? Мы частная компания и тратим на исследования свои деньги. Наши клиенты сталкиваются с рукописными паспортами и им это мешает снижая качество и скорость оказываемой услуги, вот мы и решили эту проблему.
Если про замену, то она идет естественным образом, при замене паспортов на новые, но и сейчас выдаются рукописные паспорта, по необходимости.
При том, что, ИМХО, заказчиком подобного приложения может быть только госструктура и за бюджетные деньги…
Интересно — а с рукописными паспортами за границу пускают?
Ну не скажите — с необходимостью распознавать паспорта могут сталкиваться и при продаже билетов, и при выдаче симок (которые по закону оформляются на паспорт), и банкам наверняка интересно
Понял. Только во всех этих местах ввод данных паспорта занимает меньшую часть времени оформления билета/договора. Загруженности указанных клерков я тоже особенно не вижу…
В принципе из указанных областей применения лично меня больше задевало время продажи ж.д. билетов в системе Экспресс. Вот бы её как-то оптимизировать для ускорения.
К тому же для работы с иностранными паспортами гораздо чаще полезна поддержка некириллического алфавита и спецсимволов, а также хорошее знание особенностей языка — например несочетаемых/чрезвычайно редко сочетающихся букв (иероглифов и т.п.)
За границу пускают по заграничным паспартам они все выполнены в соотвествии стандартом ISO/ICAO 9303, т.е. печатные и с MRZ.
Основная часть наших заказчиков коммерческие структуры, не связанные с государством, гос. инвестиций не имеем.
Речь не об инвестициях — речь об оплате конкретной разработки. Как показал кризис коммерческие структуры и являются основными потребителями/прожирателями бюджетных денег.
Пока не встречал бизнеса, у которого настолько остро стоит данная проблема, чтобы он готов был оплатить её решение собственными средствами. Неужели еще остались регионы, где большинство паспартов рукописные?
Данная разработка сделана нами, за наш счет, в рамках развития системы.

Обрабатываете на сервере или на клиенте?

И на сервере, и на клиенте и на мобильных.
Движок может распознавать произвольный рукописный текст на страничке, или натренирован только на российские паспорта? Используете ли базу имен для валидации результата?
  1. Планируете ли вы выкладывать модели и датасеты в публичный доступ?
  2. Какие у вашей системы метрики на различных валидационных выборках?
  3. Сравнивали ли вы ваш multi-stage подход допустим с тем, чтобы делать так — классификация => вырезание ROI со словами (глобально не важно как это делать) => e2e сетка с CTC лоссом для распознавания конкретного слова? Почему так не делалили?
  4. Я верно понял, что вся игра с "ручной" генерацией разметки из прописей сделана из-за того, что у вас попросту не было датасета с ручными паспортами?
  5. Правильно ли я понимаю, что вследствие пунктов (1) и (4) — качество низкое (про него в статье нет ни слова!)?;
  6. Оценивали ли качество каждого алгоритма в пайплайне? Классификация, детекция, нарезка на буквы, классификация? Мне кажется полный e2e тут не оправдан, но первые два и последние два этапа можно слить (CenterNet + UNet на фразы, вместо второго этапа — просто CTC сетка). Все таки оптимизировать 2 алгоритма лучше, чем 4. Хотя первый и четвертный тут очень простые.
Мы сделали и описали работающую технологию, работает хорошо, заказчики пользуются. Пункты 1-6 мы планируем подробно осветить в наших научных публикациях, как например сделали это для распознавания печатного текста.
Y. S. Chernyshova, A. V. Sheshkus and V. V. Arlazarov, «Two-Step CNN Framework for Text Line Recognition in Camera-Captured Images,» in IEEE Access, vol. 8, pp. 32587-32600, 2020, doi: 10.1109/ACCESS.2020.2974051.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий