Комментарии 36
Не везде принтеры были?
Он же в РФ бессрочный с 45 лет, да и с 20 тоже долго «живёт».
Спасибо за статью!
Интересует мобильный SDK для распознавания документов. Можете сориентировать по ценам (хотя бы примерно) и условиям лицензирования (в месяц / за приложение / за объем)?
Нда, пообщался я с вашими продажниками. Если они не могут даже порядок цен и условия лицензирования сообщить без того, чтобы я им предварительно доложил, кто я, из какой компании, зачем мне этот SDK нужен, и написал с корпоративного ящика, то продолжать общение как-то не очень хочется.
Та оно как на рынке в туристической зоне — цена зависит от внешнего вида, цвета кожи, акцента и прочих параметров покупателя.
Выводы об авторе запроса вы делаете интересные, но неправильные.
В моем случае это означает, что я еще не определился, хочу ли я покупать софт именно у вас. И поскольку эта функциональность для нас в настоящее время не основная, то решающим фактором становится цена. Одно дело, если софт обойдется, скажем, в 100 евро в месяц, другое дело – если в 1000. В последнем случае бюджет мне на него никто не одобрит, каким бы этот софт замечательным ни был, пусть он хоть в перерывах между сканированием документов варит кофе и рассказывает анекдоты.
Цель использования я кстати написал в переписке с вашими сотрудниками (аж сам директор по специальным проектам ответил, приятно).
А название компании выпытывать – это, знаете ли, так себе. Я как бы и не скрываю, где я работаю, но если я прихожу в магазин, а мне говорят: "Не хотите назвать свое имя, и зачем вам наш пылесос? Ну это свидетельствует о том, что покупать его вы не намерены. Не продадим и цену на него не скажем" – то мне хочется побыстрее из этого магазина уйти.
ru.wikipedia.org/wiki/Институт_системного_анализа_Российской_академии_наук
Представьте, если система работает в аэропорту и из-за ошибки человек не смог улететь своим рейсом. Здесь как с беспилотными автомобилями, либо работает на 100%, либо это выльется в большие проблемы.
В аэропорту по внутреннему паспорту в РФ летают?
Или заграны от руки пишут?
Серьёзно оценивать практическую годность технологии, наверное, можно было бы по выборке из х00-х000 студенческих конспектов по разным предметам, различных анкет, где шрифт налагается на надписи самой анкеты и т.п…
Меня лишь смутил ваш комментарий про оценку практической годности. С моей точки зрения практическая оценка технологии должна проводиться не по общности применения, а как раз наоборот — по применимости к конкретному целевому объекту, адекватном понимании особенностей конкретной задачи и их учете. Иначе получается (может не очень хорошая аналогия, но все же), что очки на минус 3 это плохое технологическое решение, потому что не подходят для людей, у которых зрение минус 5, и серьезно для практического использования можно будет рассматривать только очки, подходящие всем сразу…
Поскольку деньги бюджетные — считаю проще было бы потерпеть до замены последних рукописных паспортов, если речь не идёт о какой то региональной аномалии.
Если про замену, то она идет естественным образом, при замене паспортов на новые, но и сейчас выдаются рукописные паспорта, по необходимости.
Интересно — а с рукописными паспортами за границу пускают?
В принципе из указанных областей применения лично меня больше задевало время продажи ж.д. билетов в системе Экспресс. Вот бы её как-то оптимизировать для ускорения.
К тому же для работы с иностранными паспортами гораздо чаще полезна поддержка некириллического алфавита и спецсимволов, а также хорошее знание особенностей языка — например несочетаемых/чрезвычайно редко сочетающихся букв (иероглифов и т.п.)
Основная часть наших заказчиков коммерческие структуры, не связанные с государством, гос. инвестиций не имеем.
Пока не встречал бизнеса, у которого настолько остро стоит данная проблема, чтобы он готов был оплатить её решение собственными средствами. Неужели еще остались регионы, где большинство паспартов рукописные?
Обрабатываете на сервере или на клиенте?
- Планируете ли вы выкладывать модели и датасеты в публичный доступ?
- Какие у вашей системы метрики на различных валидационных выборках?
- Сравнивали ли вы ваш multi-stage подход допустим с тем, чтобы делать так — классификация => вырезание ROI со словами (глобально не важно как это делать) => e2e сетка с CTC лоссом для распознавания конкретного слова? Почему так не делалили?
- Я верно понял, что вся игра с "ручной" генерацией разметки из прописей сделана из-за того, что у вас попросту не было датасета с ручными паспортами?
- Правильно ли я понимаю, что вследствие пунктов (1) и (4) — качество низкое (про него в статье нет ни слова!)?;
- Оценивали ли качество каждого алгоритма в пайплайне? Классификация, детекция, нарезка на буквы, классификация? Мне кажется полный e2e тут не оправдан, но первые два и последние два этапа можно слить (CenterNet + UNet на фразы, вместо второго этапа — просто CTC сетка). Все таки оптимизировать 2 алгоритма лучше, чем 4. Хотя первый и четвертный тут очень простые.
Y. S. Chernyshova, A. V. Sheshkus and V. V. Arlazarov, «Two-Step CNN Framework for Text Line Recognition in Camera-Captured Images,» in IEEE Access, vol. 8, pp. 32587-32600, 2020, doi: 10.1109/ACCESS.2020.2974051.
Сколько нужно программистов и прописей, чтобы распознать рукописный паспорт?