Pull to refresh

Comments 37

Мне казалось, что здесь должны были использоваться Harr-вейвлеты, а оно вон значит как.
Спасибо, познавательно. Как раз хотел когда-нибудь разобраться в этом вопросе :)
А как вы хотели тут применять Haar-вейвлеты?..
Наверное имелись в виду каскады Хаара (Виолы, Джонс), а не вейвлеты, это разные вещи. Каскады бы здорово ускорили детектирование, но их обучение мучительно и долго (2-3 дня на топовом Xeon).
Оффтоп: странно, но не могу поставить плюс посту, хотя раньше всё ставилось.
Чтобы проголосовать за пост, карма теперь должна быть ≥10.
Lighting. Посмотрел в GIMP — они перевели как «светлота». Еще можно как «освещенность». Не знаю какой термин более уместный. Выбрал «светлота» — она ближе пользователям GIMP'а
Лучше всё-таки «освещённость» или «интенсивность света»
Когда мне понадобилось решить эту же задачу, я использовал открытую библиотеку ArUco. Качество и скорость распознования были вполне приемлимы для той задачи (игра с доп. реальностью для iPhone).
Да, я когда писал статью смотрел в исходники этой библиотеки. На основе OpenCV делаются графические преобразования, а математика как в ARToolkit. Учитывая развитие графических функций OpenCV, она может даже производительнее чем написанные реализации ARtoolkit.
Спасибо, понравилось. Продолжайте обязательно :-)
p.s. «например так[рисунок10]» рисунок потерялся, добавьте.
Интересно, а для распознавания автомобильных номеров подойдёт этот метод?
Здесь комбинация методов. И при распознавании номеров, например для определения где на картинке находится табличка с номером, их можно попробовать.
Хорошая статья. Вот только в реальности кроме поиска и распознавания нужно еще как-то отсеивать ложные срабатывания, и что-то делать с частично закрытыми маркерами — алгоритмы, основанные на замкнутых областях, легко обмануть лишней темной черточкой на изображении, или разрывом, возникшим из-за низкого разрешения камеры. Нужны методы, основанные на интегральных храрктеристиках, а они требуют много времени…
Интересно, как алгоритм Дугласа-Пекера выглядит для замкнутых контуров. То, что описано по ссылке, работает только для относительно прямого сегмента, и не очень устойчиво к шуму: если алгоритму предложить три зашумленных отрезка трапеции (короткое основание и две боковых стороны), он начнет с того, что выберет в качестве вершины самую неправильную точку на основании. И больше ее не уберет.
Да, есть такие проблемы. Но тут идея какая — должна быть почти идеальная ситуация — т.е. хорошо напечатанный маркер без засветов, нормальное освещение.
А фильтрация — да, именно потому внутрь квадрата добаляют простой идентификатор, который потом распознают. Как распознают, чтобы быстрее — это тема для отдельной статьи, притом на любителя.
В OpenCV есть функция approxPolyDP, которая работает по этому алгоритму. Можно с ней поиграться на разных изображениях.
А Вы не занимались распознованием натуральных изображений в качестве маркеров?
Я давно этой темой занимаюсь, и хороших людей в комманду найти не могу =(
вот мои результаты
Видео уже не новые, да и больше технического плана, сейчас все работает куда лучше 0=)
Все делал с нуля (то есть создаю свой фрейворк).
Кому интересно — ю ар велкам! =)

// да, видео с bmw хоть и красивое, и всеми агенствами пихается как демо — оно фейковое… монтаж, такое системы не существовало, так что поменяйте на что-нибудь хотя бы типа PTAM.
т.е. создание произвольного маркера. Тут проблема в том, что произвольный маркер должен обладать свойствами для «быстрого и надежного» распознавания. Т.е. он должен быть контрастным, и т.д. Отдельная песня — разная цветопередача и сегментация. Т.е. получается что для каждого изображения нужно делать свой распознаватель. И пока, то с чем я сталкивался, подсказывает мне что для разных изображений понадобятся разные комбинации простых алгоритмов.

А про BMW — жаль что не существовало… Вот тут автор расказывает что у американских военных разрабатывается что-то подобное. graphics.cs.columbia.edu/projects/armar/index.htm Потому я и подумал что не фейк.

А вообще — при распознавании всегда заужается область и ограничивается задача. Взять хоть файнридер, хоть распознавание номеров автомобиля…
Нет, свой «распознователь» для каждого изображения конечно не пишется, там просто совсем другие методики! Да и как ты видел, все работает, и примеров больше чем достаточно. Глвное чтобы маркер не был совсем монотонным, а так пофиг, все довольно устойчиво.

// насчет бмв, даже достаточно подумать над разумностью такой идеи… если в авторизованном сервис центре чуваку механику надо подскахывать какой винт крутить — нафиг такие механики… это не тот кейс где допреал будет решать
C механикой не все так просто. Уровень квалификации решает. Такие очки позволят снизить «порог» входа в механики. Но согласен, на вскидку — выглядит мутно. Единственное — это может помочь монополизировать сферу ремонта авто. Хочешь открыть мастерскую — купи комплект, в бумаге уже не выдаем. Только так — дорого и удобно. Эдакий макдональдс. Где работают не повара, а рабочие.
Плюс человеческий фактор. Наверное тонны пластиковых замочков переломаны молодыми неопытными механиками.

Файн ридер и поиск номеров — другого поля ягоды.
Например вы выше говорили о применении методики к поиску номеров… это немного абсурдно.

В поиске черно-белого маркера, найти границы, чтобы посчитать гомографию — дальше все тривиально

В номерах границы искать бестолку. так как они порой на видео слишком малые, там все решается натаскиванием классификатора (будь то небольшая нейронка, многочлен или ядровая функция). Там суть — найти на изображение пятно-номера, как и с детекцией лиц.

// для чб маркеров возможное применение — если только построить классификатор для предварительного сужения области, где будет работать «тяжеловестный» метод поиска контуров, чтобы все ускорить

В детекции натуральных маркеров (любых изображений) там ещё другое, там пляшут вокруг ключевых точек, и пытаются придумать/построить максимально инвариантное описание некоего окружения вокрут этих точек, чтобы дальше искать схожее на кадре и предоставленном маркером.
Вроде бы согласен, но вроде бы и не так. Пятно найти — да, согласен. А потом внутри пятна — обесцветить, перевсти в ЧБ, найти угол и т.д. Комбинация маленьких алгоритмов.
Вы про номера? или про поиск пятна чб маркера?
Ключевые точки обычно оказываются паразитными пятнами, всплесками и прочими проявлениями шума. Как и границы. Хотя сшивки панорам работают, причем вообще без подсказок — как они сопоставляют картинки?
Нет, ключевая точка — это не шум, это ярковыроженное локальное поведение функции.
Сильный локальный экстремум (как в 90% случаем принимается).

" как они сопоставляют картинки?" — По ключевым точкам =)
а что вы подразумеваете под «подсказками»?
Самое ярковыраженное поведение функции — это битый пиксель. Или резкоочерченное пятно на матрице.
«подсказки» — когда вручную «примерно» совмещаешь снимки, а алгоритм оптимизирует это совмещение.
//А Вы не занимались распознованием натуральных изображений в качестве маркеров?
//Я давно этой темой занимаюсь, и хороших людей в комманду найти не могу =(

Посмотрел видео — да интересно, вроде бы и здорово. Но это проект на свободную часть дня и больше ради удовольствия. А я к сожалению сейчас себе регулярно этого не могу позволить. А было бы интересно.
и получить в результате еще и угол поворота, используя преобразование Хафа:

Картинки нету.
Прозрачно, что для перевода изображения в двухцветное состояние используется определенный порог.

Не распарсил :) Что подразумевалось под «прозрачно, что»?
Преобразование Хафа: Картинка планировалась, но потом оказалось что нужно несколько картинок и еще одна страница беглого объяснения к ним. А двоеточие то осталось. Вот ссылка на хорошую статью об этом методе www.waset.org/journals/waset/v42/v42-9.pdf.

Прозрачно = Понятно.
Каюсь, Можно ссылку на статью зачем все это нужно? Спасибо.
Благодарю, как-раз иду в зал играть в настольный теннис, и до последнего буду сопротивляться, и играть за обычным столом, не понимаю зачем это делать перед телевизором… Желание крупных компаний обогатиться засчёт незнания людей о том что им на самом деле нужно уже вызывает неприятное жжение в горле. К сожалению тут происходит именно навязывание и игра на человеческих слабостях а не естественный отбор применения технологий.
UFO just landed and posted this here
UFO just landed and posted this here
Sign up to leave a comment.

Articles

Change theme settings