Как стать автором
Обновить

Комментарии 23

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Если у вас возникнут интересные предложения, то никогда не поздно предложить их без конкурса.
Не участвовал в этом конкурсе потому что заметка на хабре была больше похожа на рекламу Шри-Ланки, чем на конкурс по CV. Прочитав название «Увлекаешься компьютерным зрением? Ivideon зовет тебя на Шри-Ланку!» сразу закрыл :)
Во-первых, мне совсем не хочется ехать на Шри-Ланку. А во-вторых, я CV не увлекаюсь, я в нем работаю. Я конечно понимаю, что компания себе ищет молодых разработчиков, но тогда и не стоит удивляться что профи не откликнулись на этот конкурс.
Хотя тема конкурса была вполне себе интересная…
Ну, что можно сказать. Далеко не всегда важно, что человек умеет или не умет. Намного важнее насколько он разделяет общие интересы и цели команды. Мы считаем, что только чем-то по настоящему увлекаясь можно достичь высот, а не просто работая. Если у вас другое мнение, то вы просто не подходите нам по духу. Как говорится, одинаково важно не взять неправильных людей точно также как и взять правильных.
Ну а что касается профи, позвольте пересказать одну старую историю:

Когда в 1930-х годах в General Electric новые инженеры присоединились к группе, занимающейся лампами накаливания, начальник подразделения захотел сыграть с ними злую шутку. Он задал им изобрести такое покрытие для лампочки, которое позволило избавиться от зоны перегрева в новейшем на то время варианте разработки.
Шутка состояла в том, что подобную лампочку, излучающую однородный свет было «невозможно» создать. Инженеры друг за другом совершали такие попытки и заканчивали ни с чем. И когда каждый новичок признавал свой провал и ему рассказывали о невыполнимости задания, место действия оглашалось смехом остальных инженеров. Такая церемония приема прекрасно использовалась, пока однажды новый инженер не пришел с лампочкой и вкрутив её спросил это ли решение требовалось.
После рассмотрения «невозможной лампочки» оказалось, что это было именно оно.

Мы ищем людей, которые не только разбираются в азах CV, но и верят в то, что те вещи, которые еще не созданы не являются невозможными, а просто до них еще не додумались.

Кстати, скажите, пожалуйста, с прикладной точки зрения какие проекты в области CV реализуются на C#? Назовите, пожалуйста, парочку успешных и внедренных, если это не тайна. В вашем профиле увидел C#, но не увидел C++.
Что ушло в openSource?
Не совсем понятен ваш вопрос. Исходя из условий конкурса, решение должно было в первую очередь основываться на Open Source библиотеке компьютерного зрения OpenCV. Если говорить о полученном результате как интересном для Open Source, то об этом пока рано говорить. Это всего-лишь пример.

Более того у нас пока не прижилась практика Open Source. В свое время мы предлагали участие в нашем проекте независимым разработчикам по созданию на базе нашего сервиса собственных решений. Например, приложений для других мобильных платформ, которые у нас отсутствуют. мы хотели их сделать Open Source. Но в итоге все сводилось к тому, что данный вариант является не интересным для разработчиков.

а цена вопроса?
Отличный конкурс, и судя по последнему скриншоту, отличный результат. Если это не является тайной, расскажите хотя бы в общих чертах о том как были решены поставленные задачи. Какие алгоритмы использовались, и глядишь на следующий ваш конкурс будет уже больше конкурсных работ.
Последний (как и первый скриншот) не показывает работу алгоритма — победителя. Он был взят для оформления статьи из работы, представленной в Оксфорде. Хотя безусловно он очень близок к полученному результату. Разве что в нем не детектируются лица людей.

Мы договорились с победителем, что он поможет нам доработать свой пример до реализации готового модуля. Например, будет доработана визуальная калибровка камеры, которая поможет интуитивно и легко установить параметры сцены наблюдения. Это позволит вычислять реальные размеры детектируемых объектов (площадь человека далеко от камеры меньше, чем площадь человека, находящегося ближе) и их скорость перемещения.

Кстати, тут уже может быть идея для следующего конкурса. Как автоматически калибровать камеру? Хотя с одной стационарно расположенной камерой глубину сцены сложно определить. Из известных мне алгоритмов требуется как минимум переместить эту камеру в соседнюю точку и получить снимок с другого ракурса.

Кроме того, мы получили хороший алгоритм трекинга. Необходимо сделать его оптимальнее для уменьшения нагрузки на процессор и на его основе построить дополнительные модули аналитики. Выход объекта из зоны (человек вошел в дверь, а не прошел мимо неё), долгое нахождение в зоне (остановка разрешена, а стоянка — нет) и другие.

После того как это будет проделано, мы обязательно напишем статью о реализации и выпустим приложение с полученными функциями аналитики. Оптимистично это будет реализовано ближе к середине — концу февраля.
Отлично, удачи вам! Будем ждать новых хороших статей.
Поделитесь, пожалуйста, ссылкой на работу из Оксфорда.
Пожалуйста. Там много интересных работ.
Спасибо, будем смотреть
НЛО прилетело и опубликовало эту надпись здесь
Перемещать камеру — это совсем не автоматический подход. Показывать зараннее извесную мишень (калибрейшен паттерн) тоже не автоматический, но, хотя-бы, полностью софтверный и легко осуществимый.

Но 100% true подход — это отталкиваться от размеров известных объектов. Дорожный знак увидели — вот вам известный размер.

Но еще круче будет, если отталкиваться от предположения что медиана (ну или лучше truncated mean) человеческого роста — есть величина постоянная. Вы же именно людей трэкаете. Вот если реализуете калибрацию на основе подобных предположений — журнальная публикация и SIGGRAPH вам обеспечены :) А так же почет и слава.
Не могли бы Вы сказать, что лежит в основе победившего алгоритма? Может это какая-то статья или фундаментальный подход, примененный к конкретной задаче.
В победившем алгоритме нет ничего сверх нового. Это комбинация MOG (Mixture of gaussians by Stauffer and Grimson), о которой можно отчасти почитать здесь.

А также встроенной в OpenCV функции findContours, в свою очередь основанной на работах еще 85 года.

Самое важное это то, что победитель показал понимание алгоритмов компьютерного зрения. Их стоимость с точки зрения ресурсов процессора, как и куда их можно развивать в дальнейшем, чем отличаются те или иные реализации.

Кроме того в OpenCV представлено много старых и проверенных алгоритмов. Победитель также показал более современные и эффективные работы. Правда некоторые из них подпадают под патенты и требуют либо переработки, либо общения обладателями патентов.

А почему тогда на картинке изображен судя по всему HoG?)
Ну, на этот вопрос я уже ответил в комментарии.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий