Pull to refresh

Comments 37

впечатляет, интересно как решалась проблема поиска лиц у людей с разным цветом кожи, есть подозрение что примитив может и не подойти.
вполне подходит — кожа людей весьма специфично отражает свет
Тут многое зависит от условий освещения и ракурса. Но из десятков тысяч примитивов какой-то один всё равно будет более эффективным.
У меня более актуальный вопрос. Каким образом распознавать объекты на видео в реальном времени? Насколько трудоемки такие процессы и какие методы могут быть использованы?
Наверное надо сначала вспомнить, что видео — это 24 картинки в секунду(если говорить о фильмах).
В методе автора поста обработка одной картинки занимала 14 мс, то есть 24 картинки обработаются за 336мс, что меньше секунды. Приведённым методом НЛО можно распознавать и на видео =)
Ура! Очень обнадеживающая информация, а то собираюсь магистерскую делать на тему дополненной реальности, а там распознавание объектов на видео очень важно :)
А можешь потом статью написать по мотивам? Я думаю, многим было бы интересно почитать…
У меня два года на это дело, так что в ближайшее время не ждите… А в будущем — все возможно :)
Понятно что если задействовать достаточные вычислительные ресурсы можно обрабатывать и 240 и 2400 кадров в секунду.
Но ведь видео это не просто 24 картинки в секунду. Картинки связаны между собой (при онлайн-съемке). Есть ли алгоритмы межкадрового взаимодействия? Когда не просто 24 компьютера обрабатывают 24 картинки в секунду и каждый по отдельности отвечает на вопрос «Есть ли жизнь на Марсе?».
C помощью стандартных каскадов OpenCV для детекции лиц, обычный компьютер вполне справляется с видео
Почитайте статью ссылку на которую я дал в конце. Там они используют методику для поиска робота в видеопотоке. Всё прекрасно работает. :)
Интересно, спасибо :)

А вот такой вопрос — можно ли применить подобный механизм для задаач сходных с теми что представлены в проекте GalaxyZoo?

Если кратко, то там используется методика краудсорсинга для определения направления вращения спиральных галактик (против и по часовой стрелке). Конечно, условия для машины там адские — больше интуитивно определяется, нежели видно непосредственно. Но все же :)

Насчёт подобного механизма не знаю, но если посмотреть вкупе с другими методами, то автоматический классификатор написать реально. Вопрос только в том насколько он будет эффективен по сравнению с краудсорсингом? Есть ли смысл «заморачиваться»?
У нас в Нижнем на Покровке стоят скульптуры «из прошлого», и как-то у брата мыльница обнаружила лицо на скульптуре мальчика-чистильщика обуви.
А у скульптуры фотографа? Или Козы в начале Покровки? /юмор/
Вообще же статья довольно интересная, но видимо из-за моей невнимательности и непросвящённости непонятно, в чём координальное отличие от иных алгоритмов распознавания?
Вот это тоже интересно. Какие алгоритмы применяются в камерах? Хотя работают они определённо как-то фиговенько (по-крайней мере в моей:) ).
С огромным нетерпением жду следующей статьи на тему. Очень интересная а главное полезная статья, как раз то что нужно.
Ну статью на хабре в литературе можно упомянуть :)
Данный алгоритм, кстати, применим и в системах биометрического контроля доступа. Только там набор «семплов», например для пальца, немного другой, но смысл тот же.
А вы уверены что на предпоследней картинке слева вверху ложное срабатывание? :)
Представте, благодаря этой методике на фотке нашлось настоящее НЛО! :)
В процессе работы над статьёй я понял, что они повсюду! :)
А не могли бы вы выложить цветные картинки в большом формате куда-нибудь? Я про космические. Понравились очень.
Не помню откуда качал. А как скачал сразу сделал ресайз :(
Скажите, а какую методику лучше использовать, например, для выделения впадин на плоскости? Освещение падает под углом, поэтому одна кромка более светлая, чем фон, другая — более темная. Хотя на глаз впадины легко определяются, непонятно как правильнее распознавать такие объекты автоматически.
Сложно сказать навскидку. Понятно, что нужно ориентироваться на яркость. Для начала я бы попытался получить какую-то трансформанту исходного изображения, чтобы области пониженной яркости выделялись чётко. После чего, если кроме впадин там ничего нет, то нужно сразу искать эти области. Если же кроме впадин там есть ещё объекты, то необходимо завязываться на другие признаки, например форму. По границе впадины и яркой области можно провести дугу, следовательно необходимо определить насколько зетемнённая область апроксимируется дугой. Для этого можно использовать генетические алгоритмы (реализацию можете посмотреть в статьях на хабре, тут для параболы есть) или преобразования хафа с уравнением круга/дуги (я их описывал в своей статье по взлому капчи).

Ну, в общем, это то, что сразу в голову пришло.
Если ничего больше нет на изображении, то можно попробовать либо привести к полутоновому и детектором границ Канни определить эти самые границы, а затем выделить их с помощью операций дилатации и открытия, либо сразу сделать изображение бинаризованным с помощью метода Отсу, а потом делать по нему адаптивное пороговое преобразование
Хостинг картинок лежит. Без иллюстраций, статья сильно теряет :(
Спасибо! А какие примитивы были выбраны алгоритмом для поиска НЛО?
Хорошая статья, а как можно посмотреть какие примитивы были применены в итоге для распознавания?
Ага. Потому что автор не загрузил их на Хабр,
а указал ссылки на сторонний сайт:

Only those users with full accounts are able to leave comments. Log in, please.