Pull to refresh

Comments 14

Лишний раз убеждаюсь, что всегда можно найти задачу, просто оглянувшись вокруг.

я думаю, что данную задачу правильнее и проще решать Икее в своем приложении по типу "горячо-холодно"

Два года назад была опубликована статья Технология распознавания этикеток на примере ярлыков из IKEA, так что новой задачу назвать сложно. Там и приложение из AppStore скачать можно, чтобы сравнить качество работы с авторской (offline базы товаров там тоже есть).

Тем не менее, в данной статье присутствует открытая реализация, что полезно.
Пол-года назад писал распознавание автомобильных номеров с помощью OpenCV. Пробовал Tesseract для распознавания текста, но с таким разрешением, которое было у меня, он не справлялся. Но поскольку на российских автономерах ограниченный набор символов и всегда одинаковый шрифт, у меня получилось написать эффективный алгоритм самому, и я очень удивился насколько это просто делается при помощи OpenCV и Python, хотя до этого вообще не имел опыта ни с тем ни с другим.
К слову, OpenCV 3+ вроде как из коробки умеет распознавать english+alphabets, если я ничего не путаю. Tesseract с номерами справится легко, скорее всего вы просто «не умеете его готовить», но если своё решение работает удовлетворительно, то что может быть лучше? )
Я, если честно, сам склоняюсь к «не умею готовить». Не смог найти более-менее понятный мануал по настройке.
UFO just landed and posted this here
Привет! Очень интересный пост! Но, я не уловил один момент, где Вы находите вершины чека «top-left,rigth | bottom left,right». Если не трудно можете привести пример?
смотрите метод pointOrder, я по тексту как раз описал как это делается.
Я подобное на андроиде помощью tensorflow делал.
статью-пруф в студию ) правда, интересно
Гораздо веселее становится, когда у нас изображение намного более плохого качества… Тут уже и начинаешься задумываться и о алгоритмах бинаризации, и о устранении перспективных искажений с учётом соотношения сторон, и много чём другом… Рекомендую блог Abbyy на эту тему — парни в этом явно разбираются.
Как раз был на этих выходных в казанской IKEA.



На сколько ваш алгоритм распознавания усложнится при наличии нескольких товаров на карточке?
Как построится карта маршрута? Как в навигаторе, с промежуточными точками? А тогда, будет ли предложенный путь между стеллажами самым коротким?
В репе как раз есть подобный чек
https://github.com/trin4ik/bender-vision-ikea/blob/master/public/images/ikea-4.jpg
в данный момент алгоритм ищет только те чеки, о которых идёт речь в статье и в примерах. Однако нет никаких сложностей распознавать и совмешённые чеки, чуть позже добью.
Ну и алгоритм блуждания по складу это просто поиск кратчайшего пути, ничего сложного там как раз нет.
Sign up to leave a comment.

Articles