Как стать автором
Обновить

Комментарии 11

А нельзя ли улучшить качество исходного фото? Для карточек можно использовать подсветку сбоку чтоб проявлять рельеф букв.

Да вообще можно в ИК снимать. Все машиночитаемых документы в ИК без подложек. Беда в том что это речь про мобильные камеры.

Для машиночитаемых зон — это, конечно, правда. Но тут речь в основном про банковские карты, и ИК не поможет. Даже если бы он был на смартфоне.
Да, там это эмбосирование посеребреное и глазами плохо читается. Однако, ИК бы помог все равно, снизив большое количество цветной типографской графики, если она конечно не черная. Я как то проверял смартфон на чувствительность к ИК. У него заметно большая чувствительность чем у фотокамер. По крайней мере пульты от телевизора так показывают)
Более того, мне кажется что это сделано специально, так как борьба за освещение мобильных камер требует брать максимум любого источника, лишь бы был.
Как правило, нет. Во-первых, никогда неизвестно как именно пользователь сфотографирует карточку, и в каких условиях ему придется это делать. Во-вторых, не на всех картах рельефный шрифт.
Но есть же карточки, где буквы «нацарапаны» лазером, есть, где вообще просто краской нанесены…

Ё это же про кириллицу речь? Вроде бы уникальный символ. После латиницы крайне маловероятно его нахождение. Уж тем более без пробела. Смешение языков встречал только в номерах свидетельств о рождении внизу. Но там разделение дефисом I-БО.

Вообще, цель картинки — показать, что иногда на фонах возникают «призраки» символов. Там может возникнуть что угодно для какого угодно алфавита. Но да, правда, что иногда такое можно попробовать убрать проверкой алфавита. Только это могла быть не русская Ё) А, например, албанская, фактически латинская E c умлаутом.
верно, мне всегда казалось, что после распознавания на этапе валидации можно получать данные от сети не только строкой, но и массивом возможных значений, выбрать из которых вероятные можно уже опираясь как на шаблон документа так и его язык.
Да, так и делается. Но много отсечь получится не всегда. Допустим, для «пола», где зачастую только M/F бывает, отсечения отлично работают. Но практически не работают для адресов. Там всегда может быть любая буква алфавита, а еще цифры и пунктуация. Возвращаясь к нашему примеру с Ё: в уже упомянутом албанском — это одна из самых частых букв. Другой часто встречаемый случай — распознавание буквы I, если на картинках почему-то образовалась вертикальная черта.
Запятая тоже довольно сложная штука.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий