Pull to refresh

Comments 15

Имхо главная проблема разрешение исходного изображения.
При достаточном разрешении в большинстве случаев работают неплохо даже простые алгоритмы.


Зы opencv не стоит рассматривать как систему, это же конструктор и результат зависит в первую очередь от того что из этого конструктора соберут

У нас в тестовом датасете изображения с разрешением не меньше 1Мпикс с разных телефонов.

Согласен. И я не понимаю, какое двуногое животное не может увеличить куркод на ЖКХ квитанции.

Использовать для оценки работы софта распознавания статичные кадры плохая идея. Потому что пользователи не фотографируют код, чтобы потом его загрузить в программу, а реалтайм наводят камеру до сработки считывания. А значит, все варианты «мелкий код под кривым углом» уже не релевантные — человек просто поднесёт телефон ближе к коду.
А вот что могло бы существенно улучшить «экспириенс», так это скан кода не по одному фото, а с учётом прошлых кадров видеоряда. Например, код под глянцевой наклейкой или голограммой, когда в любой момент времени половина кода не видна. Тогда на основании других кадров можно было бы построить в памяти полную карту кода и распознать его.

Ну и не могли бы объяснить, почему сравнение точности «99% vs 81%» стало «в 19 раз меньше»?.. Отдаёт маркетологической чушью.
1. Все наши продукты умеют распознавать видеопоток в режиме реального времени. Не исключение и Smart Code Engine.
2. В данном случае мы сравнивали качество работы разных систем распознавания на отдельных кадрах.
3. Теперь насчет качества и количества ошибок. Из таблицы видно, что Smart Code Engine ошибается на 1% изображений, а Zxing — на 19% изображений.
1) Вы распознаёте видеопоток именно как поток, или просто как серию кадров, каждый из которых распознаётся отдельно?
2) Но это же лишено практического смысла.
3) То есть всё-таки маркетинговая чушь, ведь «на 22% точнее» звучит гораздо менее пафосно. Ещё можете выкинуть из подборки картинку, на которой была единственная ошибка, и впечатлять инвесторов и лохов в сети «в бесконечно раз меньше ошибок».

Судя по тому, что 1% это одна ошибка, а 19% — 19 ошибок, то вы собрали ровно 100 картинок. Это ничтожно мало для оценки системы, а очень сильно смахивает на «мы отобрали те семплы, где наша система не ошибается, а конкуренты ошибаются». Если бы речь шла о «мы спарсили 100к фото кодов из интернета», то (не смотря на ошибочность концепции такого теста) это было бы уже что-то.

Тут все очень просто. Мы собрали небольшой датасет и оценили своё решение и два известных открытых. Кроме того, наш движок, хоть на миллиарде фото из интернета, можете самостоятельно испытать, просто скачав мобильное приложение — https://apps.apple.com/ru/app/smart-idreader/id1157877082

Погодите, вы на этой жалкой выборке из 100 фото вручную проверяли?..
Это как продавать авто, сделав тест только на 100 метрах тестового полигона, который заранее с мылом вымыли.
Вопросов нет, смысла общаться дальше тоже.

Вам предложили самостоятельно проехать после 100 метров сколь угодно далеко. Но я согласен, что малые цифры в статьях обычно вызывают оскорбление чувств хабрующих.

Я не разбираюсь в теме мобильного зрения.
Когда потребовалось считать QR код просто подрубил.
implementation «com.google.firebase:firebase-ml-vision:24.0.3»
implementation 'com.google.firebase:firebase-ml-vision-barcode-model:16.1.1'
Это бесплатно и работает локально.

Вопрос почему Вы сравниваете свой продукт (стоимость лицензии по запросу) не с коммерческими решениями на рынке, а с опенсорсом?

У них b2b, как вы представляете, мы ваши конкуренты, дайте демку для тестов? Конечно с опенсорсом сравнение, с самыми популярными решениями. Только недавно тут обсуждали куркоды нечитаемые мобильными приложениями банков для оплаты ЖКХ квитанций.
К тому же, решения у конкурентов могут быть такие же по качеству по сравнению с опенсорсом. Сравниваться с конкурентами некорректно, кто поверит в непредвзятость? если стоит выбор платной либы — в любом случае тест нужно делать самостоятельно. Как иначе то?

У меня несколько самописных внедрённых проекта на Xamarin с распознаванием штрих-кодов. В промышленных масштабах камера смартфона нужна чуть реже, чем никогда. Скорость работы не идёт ни в какое сравнение со сканером по блютус или, как в одном из проектов, встроенным в ТСД сканером. Так что энтерпрайз отпадает. Не только из-за скорости. И да, на всякий случай, у меня во всех приложениях есть кнопка сканирования камерой (ZXing использую).
Приложения для конечных пользователей. Тут вам выше уже написали два замечания.
Первое, сложно найти кейс, когда распознавание идёт по фото. Распознают видеопоток. Так что, ваши 19% попугаев преимущества, нивелируются движением смартфона и практически незаметно для конечного пользователя. Либо распознаётся, либо нет.
Второе, ваше решение платное, непонятно сколько стоит и как решать проблемы, которые возникнут, если нет привычного гитхаб комьюнити — непонятно. Нет, вы конечно можете обещать всестороннюю поддержку после покупки решения, но, бесплатного ничего не бывает. Если вы берёте на себя обязательства, значит они должны быть компенсированы стоимостью. Что тоже не добавляет желания воспользоваться ради мифических (а иначе, на основании ваших тестов, и не скажешь) 19% более лучших механизмов распознавания. Зачем? Если ZXing открыт и там тысячи людей делятся опытом и советами.

При всём, при этом, техническая часть вашей разработки, вызывает уважение. Молодцы, что делаете крутые штуки. Только, к сожалению, мне не очень понятно, для кого.

Тут недавно обсуждали, что разные банки по разному читают плотно набитые куркоды ЖКХ квитанций, а вы про звёздочек на гитхабе у опенсорса.

1. Наша библиотека работает на 99 попугаев, тогда как две другие — на 81 и 56. (что за попугаи — не раскрыто).
2. Наша библиотека «ошиблась» (не распознала? распознала неправильно? что-то третье? — нет ответа) на вот такой картинке. Другая — вот ещё на этих нескольких.
3. «Покупайте наших слонов».

Я ничего значимого не упустил в этом реферате статьи?

Нет данных по ложноположительным срабатываниям, когда баркод прочитан, но прочитан неверно (вы приводите только варианты, когда код просто не считался). Да, такие ситуации встречаются, нарывался. Может быть ваша система менее надежна, а ZXing просто более строгий?


Опять же, вы показали примеры "дизайнерских" баркодов, но не сказали, как с ними справляется ваша разработка?


Про малую выборку и неактуальность упоминания OpenCV уже указали.


Предложение, и вам плюс в качестве материала для тестирования, и реклама, и мы посмотрим на актуальность: сделайте веб-страничку, где можно было бы загрузить фото баркода и получить сырые декодированные данные, чтобы мы могли их сравнить с другими решениями.

Only those users with full accounts are able to leave comments. Log in, please.