valerylinkov Mar 11 2018 at 22:07

Машинное зрение. Что это и как им пользоваться? Обработка изображений оптического источника

12 min

97K

Comments 17

Tunerok Mar 12 2018 at 01:56

У вас в результате объекты получаются «разорванными». И никакой дальнейшей обработки не происходит. Может стоит подумать о том, чтобы высчитывать оператор Лапласа или Собеля и по нему строить контур? А может сразу Кенни использовать. Существуют более надёжные способы выделить объект на изображении. Тем более он у Вас настолько очевидный и повторяющийся (по крайней мере контур). Вообще, статья похожа на лабораторную студентов курса 1-3. Особенно в части, которая описывает Ваше практическое применение «машинного зрения».

valerylinkov Mar 12 2018 at 02:03

Спасибо за идеи. В дальнейшем постараюсь реализовать.
По поводу похожести на лабораторную работу, эта статья оформлена по стандарту научного журнала. Если интересно, ссылку на оригинал оставил.

Tunerok Mar 12 2018 at 02:30

Все таки посоветую, если в будущем планируете связаться с обработкой цифровых изображений, то переходите на более гибкий софт. Особенно, если Вас не заставляют пользоваться определенным ПО. Дела даже не столько в наличии множества библиотек, сколько в возможности быстрого прототипирования и/или миграции программы.

valerylinkov Mar 12 2018 at 02:37

Если Вас не затруднит, пожалуйста, посоветуйте софт, так как тема меня интересует и привязки к софту нет.
LabView мне посоветовали в ВУЗе, поэтому на него и подсел.

Tunerok Mar 12 2018 at 03:38

Для разработки методов смотрите на Matlab и MathCad(желательно не prime, т.к. в нем порезали некоторый функционал и убрали совместимость с классическим МатКадом). В первом удобно быстро реализовать задуманное на языке близком к си/питон(скрипты), а так же реализована очень хорошая справка, во втором удобно оперировать прям формулами, что закрепляет связь между тем, что написано на языке математики и результатами этих манипуляций. Это как помощь в обучении.
Для более серьезных проектов используются уже языки программирования в связке со специализированными библиотеками. Это нужно в первую очередь из-за быстродействия, т.к. все все лабвью, матлаб и прочее при большой нагрузке начинают сдавать. Язык выбираете любой близкий Вам. Никого не слушайте — каждый свое болото хвалит, главное, чтобы язык был актуальный, живой и востребованный. Но в первую очередь понятный Вам. В качестве отправной точки посоветую посмотреть библиотеку OpenCv. Для нее существуют обертки под разные языки. Методы, реализованные в данной библиотеке стали уже почти стандартом в обработке изображений.
А дальше ждут нейронные сети и прочие вкусняшки ;)

valerylinkov Mar 12 2018 at 07:26

Большое спасибо за по-настоящему ценный и полезный комментарий!
Попробую сделать что-то ценное уже на MathCad или Mathlab. Может что-то и получиться :)
Ещё раз, спасибо!

velovich Mar 12 2018 at 09:26

Исторические прорывы в машинном зрении

1990-е годы – Первые космические системы автоматической навигации автомобилей.

Я вот тут не понял. Подразумевается общеизвестная глобальная спутниковая навигация? Какие задачи решались машинным зрением? Кроме векторизации карт ничего в голову не приходит.

valerylinkov Mar 12 2018 at 09:31

По поводу спутниковой навигации.

В числе представляющих наибольший интерес технологий и средств КВНО, разработанных в Евросоюзе – экспериментальные системы точного определения орбит космических аппаратов – DORIS и PRARE. Система DORIS (Doppler Orbitography and Radiopositioning Integrated on Satellite – «Система радиопозиционирования и определения орбиты путем измерения доплеровского сдвига частоты») была создана в начале 1990-х гг. французской компанией Dassault Electronique по заказу Французского агентства космических исследований CNES. Данная система была установлена на борту спутников TOPEX/Poseidon, Jason-1, Envisat, и SPOT-2, -4, -5. Двухчастотный (2036/401 МГц) комплект DORIS массой около 20 кг предназначен для определения местоположения спутника с точностью до 1 м, текущих значений высоты его полета до 20 см и скорости до 0,3 мм/с. В состав оборудования входят ультрастабильные кварцевые генераторы частоты. Длина передающей антенны составляет 42 см. Траекторные измерения выполняются с помощью наземной сети, в состав которой входит 75 пунктов, оснащенный радиомаяками. Использования этой системы также позволяет определять координаты взаимодействующих наземных пунктов, оснащенных соответствующим оборудованием. Так, главный измерительный пункт системы DORIS в Тулузе привязан с точностью 5 мм.

По поводу машинного зрения.

В 1990–2000-х пришло осознание того, что трехмерные формы могут быть реконструированы из фильмов и что для этого очень полезна геометрия. В 2000–2010-е была открыта польза статистических методов, пришло осознание того, что текстура играет важную роль в процессе распознания объекта. Следующим важным шагом стало применение сверточных нейронных сетей. Ян Лекун был одним из первых, кто осознал их потенциал. Несмотря на то что он пришел к этому уже в 1990-х, распространение этот метод получил к 2012 году, когда Крижевский, Сатскевер и Хинтон показали нам потрясающие результаты в классификации изображений на основе ImageNet с применением сверточных нейронных сетей.

Помимо этого, в машинном зрении появляется метод опорных векторов. Рассказывать о нём долго, поэтому прикреплю ссылку на статью в википедии.

velovich Mar 12 2018 at 12:09

Это мне ответ?

valerylinkov Mar 12 2018 at 12:38

Да :)
Оно не прикрепилось

velovich Mar 12 2018 at 12:49

Если честно, я ответа не понял. А именно, как развитие спутниковой навигации послужило прорыву в области машинного зрения. Или наоборот.

valerylinkov Mar 12 2018 at 13:00

Сейчас метод опорных векторов (прорыв машинного зрения 1990-х) используется в работах по принципу монокулярного зрения. Статья о этом
Это часть навигационного комплекса

valerylinkov Mar 12 2018 at 13:04

Нашёл историческую справку о машинном зрении.

1955 г. — профессор Массачусетского технологического института (МТИ) Оливер Селфридж опубликовал статью «Глаза и уши для компьютера». В ней автор выдвинул теоретическую идею оснащения компьютера средствами распознавания звука и изображения.

1958 г. — психолог Фрэнк Розенблатт из Корнеллского университета создал компьютерную реализацию персептрона (от perception — восприятие) — устройства, моделирующего схему распознавания образов человеческим мозгом. Персептрон был впервые смоделирован в 1958 году, причем его обучение требовало около получаса машинного времени на ЭВМ IBM-704. Аппаратный вариант — Mark I Perceptron — был построен в 1960 г. и предназначался для распознавания зрительных образов [Компьютерное зрение, 2010].

Однако рассмотрение задач машинного зрения носило скорее умозрительный характер, так как ни техники, ни математического обеспечения для решения таких сложных задач еще не было.

1960-е гг.- появление первых программных систем обработки изображений (в основном для удаления помех с фотоснимков, сделанных с самолетов и спутников), стали развиваться прикладные исследования в области распознавания печатных символов. Однако все еще существовали ограничения в развитии данной области науки, такие как отсутствие дешевых оптических систем ввода данных, ограниченность и довольно узкая специализация вычислительных систем. Бурное развитие систем компьютерного зрения на протяжении 60-х годов можно объяснить расширением использования вычислительных машин и очевидной потребностью в более быстрой и эффективной связи человека с ЭВМ. К началу 60-х годов задачи компьютерного зрения в основном охватывали область космических исследований, требовавших обработки большого количества цифровой информации.

1970-е гг. — Лавренсе Робертс, аспирант МТИ, выдвинул концепцию машинного построения трехмерных образов объектов на основе анализа их двумерных изображений. На данном этапе стал проводиться более глубокий анализ данных. Начали развиваться различные подходы к распознаванию объектов на изображении, например структурные, признаковые и текстурные.

1979 г. — профессор Ганс-Хельмут Нагель из Гамбургского университета заложил основы теории анализа динамических сцен, позволяющей распознавать движущиеся объекты в видеопотоке.

В конце 1980-х годов были созданы роботы, способные более-менее удовлетворительно оценивать окружающий мир и самостоятельно выполнять действия в естественной среде

80-е и 90-е годы ознаменовались появлением нового поколения датчиков двухмерных цифровых информационных полей различной физической природы. Развитие новых измерительных систем и методов регистрации двухмерных цифровых информационных полей в реальном масштабе времени позволило получать для анализа устойчивые во времени изображения, генерируемые этими датчиками. Совершенствование же технологий производства этих датчиков позволило существенным образом снизить их стоимость, а значит, значительно расширить область их применения

С начала 90-х годов в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с так называемой модульной парадигмой. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от «иконического» представления объектов (растровое изображение, неструктурированная информация) – к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т. п.). [Визильтер и др., 2007]

В середине 90-х годов появились первые коммерческие системы автоматической навигации автомобилей. Эффективные средства компьютерного анализа движений удалось разработать в конце XX века

2003 г. — на рынок были выпущены первые достаточно надежные корпоративные системы распознавания лиц.

velovich Mar 12 2018 at 14:09

Ну вот теперь я понял. Надо у Вас в статье вместо:
«1990-е годы – Первые космические системы автоматической навигации автомобилей»
написать:
«1990-е годы – Первые беспилотные системы управления автотранспортом»
Я похоже залез к Вам в неотредактированную статью, да? Извините.

valerylinkov Mar 12 2018 at 14:19

Рад, что Вы разобрались!

Надо у Вас в статье вместо:
«1990-е годы – Первые космические системы автоматической навигации автомобилей»
написать:
«1990-е годы – Первые беспилотные системы управления автотранспортом»

Обе фразы означают, примерно, одни и тоже. Если у Вас возникла сложность восприятия статьи в данной формулировке, прошу простить. Заменю, дабы такого не повторилось.

Я похоже залез к Вам в неотредактированную статью, да? Извините.

Ничего. Две головы всегда лучше одной. Когда пишешь один, ошибки неизбежны.

velovich Mar 12 2018 at 16:07

Обе фразы означают, примерно, одни и тоже

А вы попробуйте, задайте нескольким знакомым вопрос: «Что ты понимаешь под термином „Космическая система автоматической навигации?“. Интересно, что они ответят, „GPS“ или „Автопилот“?

velovich Mar 12 2018 at 12:09

del

Show the best of all time