ivideon 7 дек 2012 в 02:20

Конкурс по алгоритмам компьютерного зрения. Призы достаются всем

3 мин

24K

Блог компании IvideonАлгоритмы*Обработка изображений*

+45

Комментарии 23

НЛО прилетело и опубликовало эту надпись здесь

ivideon 7 дек 2012 в 21:12

Если у вас возникнут интересные предложения, то никогда не поздно предложить их без конкурса.

BigObfuscator 8 дек 2012 в 13:42

Не участвовал в этом конкурсе потому что заметка на хабре была больше похожа на рекламу Шри-Ланки, чем на конкурс по CV. Прочитав название «Увлекаешься компьютерным зрением? Ivideon зовет тебя на Шри-Ланку!» сразу закрыл :)
Во-первых, мне совсем не хочется ехать на Шри-Ланку. А во-вторых, я CV не увлекаюсь, я в нем работаю. Я конечно понимаю, что компания себе ищет молодых разработчиков, но тогда и не стоит удивляться что профи не откликнулись на этот конкурс.
Хотя тема конкурса была вполне себе интересная…

-2

ivideon 9 дек 2012 в 18:22

Ну, что можно сказать. Далеко не всегда важно, что человек умеет или не умет. Намного важнее насколько он разделяет общие интересы и цели команды. Мы считаем, что только чем-то по настоящему увлекаясь можно достичь высот, а не просто работая. Если у вас другое мнение, то вы просто не подходите нам по духу. Как говорится, одинаково важно не взять неправильных людей точно также как и взять правильных.
Ну а что касается профи, позвольте пересказать одну старую историю:

Когда в 1930-х годах в General Electric новые инженеры присоединились к группе, занимающейся лампами накаливания, начальник подразделения захотел сыграть с ними злую шутку. Он задал им изобрести такое покрытие для лампочки, которое позволило избавиться от зоны перегрева в новейшем на то время варианте разработки.
Шутка состояла в том, что подобную лампочку, излучающую однородный свет было «невозможно» создать. Инженеры друг за другом совершали такие попытки и заканчивали ни с чем. И когда каждый новичок признавал свой провал и ему рассказывали о невыполнимости задания, место действия оглашалось смехом остальных инженеров. Такая церемония приема прекрасно использовалась, пока однажды новый инженер не пришел с лампочкой и вкрутив её спросил это ли решение требовалось.
После рассмотрения «невозможной лампочки» оказалось, что это было именно оно.

Мы ищем людей, которые не только разбираются в азах CV, но и верят в то, что те вещи, которые еще не созданы не являются невозможными, а просто до них еще не додумались.

Кстати, скажите, пожалуйста, с прикладной точки зрения какие проекты в области CV реализуются на C#? Назовите, пожалуйста, парочку успешных и внедренных, если это не тайна. В вашем профиле увидел C#, но не увидел C++.

crmMaster 7 дек 2012 в 03:56

Что ушло в openSource?

ivideon 7 дек 2012 в 12:59

Не совсем понятен ваш вопрос. Исходя из условий конкурса, решение должно было в первую очередь основываться на Open Source библиотеке компьютерного зрения OpenCV. Если говорить о полученном результате как интересном для Open Source, то об этом пока рано говорить. Это всего-лишь пример.

Более того у нас пока не прижилась практика Open Source. В свое время мы предлагали участие в нашем проекте независимым разработчикам по созданию на базе нашего сервиса собственных решений. Например, приложений для других мобильных платформ, которые у нас отсутствуют. мы хотели их сделать Open Source. Но в итоге все сводилось к тому, что данный вариант является не интересным для разработчиков.

Calc 7 апр 2013 в 02:53

а цена вопроса?

InteractiveTechnology 7 дек 2012 в 04:41

Ну всё, прототип из фильма Person of Interest уже создан)

Horus20 7 дек 2012 в 06:31

Отличный конкурс, и судя по последнему скриншоту, отличный результат. Если это не является тайной, расскажите хотя бы в общих чертах о том как были решены поставленные задачи. Какие алгоритмы использовались, и глядишь на следующий ваш конкурс будет уже больше конкурсных работ.

ParkerGreen 7 дек 2012 в 09:13

Представленный скриншот не является результатом этого конкурса.

ivideon 7 дек 2012 в 09:14

Последний (как и первый скриншот) не показывает работу алгоритма — победителя. Он был взят для оформления статьи из работы, представленной в Оксфорде. Хотя безусловно он очень близок к полученному результату. Разве что в нем не детектируются лица людей.

Мы договорились с победителем, что он поможет нам доработать свой пример до реализации готового модуля. Например, будет доработана визуальная калибровка камеры, которая поможет интуитивно и легко установить параметры сцены наблюдения. Это позволит вычислять реальные размеры детектируемых объектов (площадь человека далеко от камеры меньше, чем площадь человека, находящегося ближе) и их скорость перемещения.

Кстати, тут уже может быть идея для следующего конкурса. Как автоматически калибровать камеру? Хотя с одной стационарно расположенной камерой глубину сцены сложно определить. Из известных мне алгоритмов требуется как минимум переместить эту камеру в соседнюю точку и получить снимок с другого ракурса.

Кроме того, мы получили хороший алгоритм трекинга. Необходимо сделать его оптимальнее для уменьшения нагрузки на процессор и на его основе построить дополнительные модули аналитики. Выход объекта из зоны (человек вошел в дверь, а не прошел мимо неё), долгое нахождение в зоне (остановка разрешена, а стоянка — нет) и другие.

После того как это будет проделано, мы обязательно напишем статью о реализации и выпустим приложение с полученными функциями аналитики. Оптимистично это будет реализовано ближе к середине — концу февраля.

Horus20 7 дек 2012 в 09:37

Отлично, удачи вам! Будем ждать новых хороших статей.

Xcam 7 дек 2012 в 11:38

Поделитесь, пожалуйста, ссылкой на работу из Оксфорда.

ivideon 7 дек 2012 в 11:48

Пожалуйста. Там много интересных работ.

Xcam 7 дек 2012 в 21:01

Спасибо, будем смотреть

НЛО прилетело и опубликовало эту надпись здесь

sergehog 7 дек 2012 в 13:00

Перемещать камеру — это совсем не автоматический подход. Показывать зараннее извесную мишень (калибрейшен паттерн) тоже не автоматический, но, хотя-бы, полностью софтверный и легко осуществимый.

Но 100% true подход — это отталкиваться от размеров известных объектов. Дорожный знак увидели — вот вам известный размер.

Но еще круче будет, если отталкиваться от предположения что медиана (ну или лучше truncated mean) человеческого роста — есть величина постоянная. Вы же именно людей трэкаете. Вот если реализуете калибрацию на основе подобных предположений — журнальная публикация и SIGGRAPH вам обеспечены :) А так же почет и слава.

albu 7 дек 2012 в 12:11

Не могли бы Вы сказать, что лежит в основе победившего алгоритма? Может это какая-то статья или фундаментальный подход, примененный к конкретной задаче.

ivideon 7 дек 2012 в 12:53

В победившем алгоритме нет ничего сверх нового. Это комбинация MOG (Mixture of gaussians by Stauffer and Grimson), о которой можно отчасти почитать здесь.

А также встроенной в OpenCV функции findContours, в свою очередь основанной на работах еще 85 года.

Самое важное это то, что победитель показал понимание алгоритмов компьютерного зрения. Их стоимость с точки зрения ресурсов процессора, как и куда их можно развивать в дальнейшем, чем отличаются те или иные реализации.

Кроме того в OpenCV представлено много старых и проверенных алгоритмов. Победитель также показал более современные и эффективные работы. Правда некоторые из них подпадают под патенты и требуют либо переработки, либо общения обладателями патентов.

BelBES 7 дек 2012 в 23:19

А почему тогда на картинке изображен судя по всему HoG?)

ivideon 8 дек 2012 в 00:06

Ну, на этот вопрос я уже ответил в комментарии.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий