Indalo Aug 25 2009 at 18:57

В поисках НЛО. Детект объектов на изображении

6 min

55K

Artificial Intelligence

+90

Comments 37

imps Aug 25 2009 at 19:29

впечатляет, интересно как решалась проблема поиска лиц у людей с разным цветом кожи, есть подозрение что примитив может и не подойти.

ymik Aug 25 2009 at 20:43

вполне подходит — кожа людей весьма специфично отражает свет

Indalo Aug 26 2009 at 04:56

Тут многое зависит от условий освещения и ракурса. Но из десятков тысяч примитивов какой-то один всё равно будет более эффективным.

aleksandrich Aug 25 2009 at 20:03

У меня более актуальный вопрос. Каким образом распознавать объекты на видео в реальном времени? Насколько трудоемки такие процессы и какие методы могут быть использованы?

italiano Aug 25 2009 at 20:18

Наверное надо сначала вспомнить, что видео — это 24 картинки в секунду(если говорить о фильмах).
В методе автора поста обработка одной картинки занимала 14 мс, то есть 24 картинки обработаются за 336мс, что меньше секунды. Приведённым методом НЛО можно распознавать и на видео =)

ISpy Aug 25 2009 at 20:19

Ура! Очень обнадеживающая информация, а то собираюсь магистерскую делать на тему дополненной реальности, а там распознавание объектов на видео очень важно :)

SilentBob Aug 25 2009 at 22:59

А можешь потом статью написать по мотивам? Я думаю, многим было бы интересно почитать…

ISpy Aug 25 2009 at 23:31

У меня два года на это дело, так что в ближайшее время не ждите… А в будущем — все возможно :)

Sirob039 Aug 26 2009 at 16:09

Понятно что если задействовать достаточные вычислительные ресурсы можно обрабатывать и 240 и 2400 кадров в секунду.
Но ведь видео это не просто 24 картинки в секунду. Картинки связаны между собой (при онлайн-съемке). Есть ли алгоритмы межкадрового взаимодействия? Когда не просто 24 компьютера обрабатывают 24 картинки в секунду и каждый по отдельности отвечает на вопрос «Есть ли жизнь на Марсе?».

Becoming_Insane Aug 25 2009 at 22:48

легко

Yakhnev Aug 25 2009 at 23:07

C помощью стандартных каскадов OpenCV для детекции лиц, обычный компьютер вполне справляется с видео

Indalo Aug 26 2009 at 04:57

Почитайте статью ссылку на которую я дал в конце. Там они используют методику для поиска робота в видеопотоке. Всё прекрасно работает. :)

Halt Aug 25 2009 at 20:15

Интересно, спасибо :)

А вот такой вопрос — можно ли применить подобный механизм для задаач сходных с теми что представлены в проекте GalaxyZoo?

Если кратко, то там используется методика краудсорсинга для определения направления вращения спиральных галактик (против и по часовой стрелке). Конечно, условия для машины там адские — больше интуитивно определяется, нежели видно непосредственно. Но все же :)

Indalo Aug 26 2009 at 05:01

Насчёт подобного механизма не знаю, но если посмотреть вкупе с другими методами, то автоматический классификатор написать реально. Вопрос только в том насколько он будет эффективен по сравнению с краудсорсингом? Есть ли смысл «заморачиваться»?

Shtorkin Aug 25 2009 at 20:23

У нас в Нижнем на Покровке стоят скульптуры «из прошлого», и как-то у брата мыльница обнаружила лицо на скульптуре мальчика-чистильщика обуви.

citizen Aug 25 2009 at 20:39

А у скульптуры фотографа? Или Козы в начале Покровки? /юмор/
Вообще же статья довольно интересная, но видимо из-за моей невнимательности и непросвящённости непонятно, в чём координальное отличие от иных алгоритмов распознавания?

Indalo Aug 26 2009 at 04:59

Вот это тоже интересно. Какие алгоритмы применяются в камерах? Хотя работают они определённо как-то фиговенько (по-крайней мере в моей:) ).

ISpy Aug 25 2009 at 20:30

С огромным нетерпением жду следующей статьи на тему. Очень интересная а главное полезная статья, как раз то что нужно.

Indalo Aug 26 2009 at 06:32

Меня в магистрской упомяните?:)

ISpy Aug 26 2009 at 14:05

Ну статью на хабре в литературе можно упомянуть :)

Shtorkin Aug 25 2009 at 20:49

Данный алгоритм, кстати, применим и в системах биометрического контроля доступа. Только там набор «семплов», например для пальца, немного другой, но смысл тот же.

zuix Aug 25 2009 at 21:08

А вы уверены что на предпоследней картинке слева вверху ложное срабатывание? :)
Представте, благодаря этой методике на фотке нашлось настоящее НЛО! :)

Indalo Aug 26 2009 at 04:58

В процессе работы над статьёй я понял, что они повсюду! :)

Horus20 Aug 26 2009 at 05:42

Спасибо автору за статью… интресно было почитать

вот если что еще ссылка по теме про создание каскада на русском
www.compvision.hi-tech-info.info/education.php

Indalo Aug 26 2009 at 08:39

Написано на основе этого оригинального дока: robotik.inflomatik.info/other/opencv/OpenCV_ObjectDetection_HowTo.pdf

man_without_face Aug 26 2009 at 10:51

А не могли бы вы выложить цветные картинки в большом формате куда-нибудь? Я про космические. Понравились очень.

Indalo Aug 26 2009 at 12:10

Не помню откуда качал. А как скачал сразу сделал ресайз :(

man_without_face Aug 26 2009 at 12:11

ну да ладно.

can3p Sep 5 2009 at 01:13

Скажите, а какую методику лучше использовать, например, для выделения впадин на плоскости? Освещение падает под углом, поэтому одна кромка более светлая, чем фон, другая — более темная. Хотя на глаз впадины легко определяются, непонятно как правильнее распознавать такие объекты автоматически.

Indalo Sep 6 2009 at 11:49

Сложно сказать навскидку. Понятно, что нужно ориентироваться на яркость. Для начала я бы попытался получить какую-то трансформанту исходного изображения, чтобы области пониженной яркости выделялись чётко. После чего, если кроме впадин там ничего нет, то нужно сразу искать эти области. Если же кроме впадин там есть ещё объекты, то необходимо завязываться на другие признаки, например форму. По границе впадины и яркой области можно провести дугу, следовательно необходимо определить насколько зетемнённая область апроксимируется дугой. Для этого можно использовать генетические алгоритмы (реализацию можете посмотреть в статьях на хабре, тут для параболы есть) или преобразования хафа с уравнением круга/дуги (я их описывал в своей статье по взлому капчи).

Ну, в общем, это то, что сразу в голову пришло.

skynoname Jun 6 2011 at 01:06

Если ничего больше нет на изображении, то можно попробовать либо привести к полутоновому и детектором границ Канни определить эти самые границы, а затем выделить их с помощью операций дилатации и открытия, либо сразу сделать изображение бинаризованным с помощью метода Отсу, а потом делать по нему адаптивное пороговое преобразование