Pull to refresh

Comments 7

А какова судьба ABBYY SDK для мобильной платформы, которую представляли на конференции в SanDiego в 2016 или 2017?
Помню, парень Claudio (сейчас работает во флоридском офисе абби) делал демку, когда с телефона распознавал текст в реальном времени.
Добрый день! Мы продолжаем развивать эту технологию. В этом году выпустили Mobile Capture SDK для мобильных приложений: достаточно навести камеру смартфона на документ или объект, и технология в реальном времени распознает текст и извлечет из него всю необходимую информацию.

А еще в этом году выпустили технологию ABBYY Mobile Web Capture. О ней мы не так давно рассказывали на Хабре.
Ну так что, какое приложение мне поставить, чтобы найти нужную специю в магазе, где специй 50 метров?
Для запуске на CPU пробовали квантование? С квантованным мобайлнет2 можно как минимум в 2 раза выигрыш по скорости получить на CPU (если конечно точность не деградируется сильно).
Мы пробовали квантовать сеть на tf-lite, но он требует заранее заданного размера входного изображения для конвертации. В реальной работе размер изображения может меняться в зависимости от устройства, т. к. в текущей логике мы просто ограничиваем меньшую из сторон размером в 512 px.
Насколько хорошо сеть справляется с изогнутым текстом, который нередко встречается
на вывесках?
Интересно посмотреть результаты сети на классическом датасете ICDAR 2015
(собранном, как утверждается, с использованием Google Glasses и содержащий изогнутый текст,
текст разного размера, низкого разрешения и т.д.), Total-Text или современном ArT (Arbitrary-Shaped Text dataset).

**
Если кому интересно, много ссылок на статьи и вообще неплохая подборка результатов разных методов детектирования и распознавания изогнутого текста можно посмотреть здесь: github.com/Yuliang-Liu/Curve-Text-Detector. Там же есть картинки с иллюстрацией задачи.

А вот одна из самых недавних работ с встроенным распознавание найденного текста,
фактически, state of the art: arxiv.org/abs/1910.07954.
Это не наш целевой сценарий, поэтому мы не стремились получить высокие результаты на этих датасетах. Запускали её в разрешении 512, качество неудовлетворительное, а на большем разрешении на мобильном устройстве можно запускать только на отдельном кадре.

И благодарим вас за наводку на статью со state-of-the-art решением.
Sign up to leave a comment.