Stantin Jun 27 2019 at 07:12

Распознавание дороги посредством семантической сегментации

4 min

9.7K

Image processing*Machine learning*Development for Raspberry Pi*RoboticsArtificial Intelligence

+13

Comments 26

Germanjon Jun 27 2019 at 07:26

Чисто теоретически, может быть записывать в память уже хорошо распознанные участки и не пытаться их распознать, а распознавать только «новое»?

Stantin Jun 27 2019 at 07:29

А как отличить «хорошо распознанное» от «нового»?

Germanjon Jun 27 2019 at 08:55

То, что уже на прошлых кадрах было понято как дорога и препятствие. Не могу сформулировать мысль теоретически, попробую привести сильно упрощённо на конкретном примере:
— Робот едет со скоростью 10 см/с.
— Робот «видит» на 1 метр вперёд.
— Робот распознал, что 50 сантиметров перед ним — точно (вероятность выше определённого порога) является ровной дороги.
— Через секунду он фотографирует пространство впереди (глубиной 1 метр), но пытается распознать не всю фотографию, а только то пространство, которое не является точно распознанным (в данном примере — 40 сантиметров).

Stantin Jun 27 2019 at 14:02

Предлагаете распознавать частично? Все равно большее значение имеет разрешение картинки.

d1ss4pp34r Jun 27 2019 at 16:10

Прощу прощения, что ответом на сообщение, комментарий оставить видимо карма не позволяет.

Насчёт быстродейсвия — все сегментационные сети достаточно медленные, тем более на проце. Можно попробовать intel movidus stick, думаю, на нем получится пара fps, а то и больше. Либо попробовать раза в 4 уменьшить размер входа нейросети.
А насчёт разницы между u- и e-net, думаю, для такого прототипа она вообще не принципиальна. Можно опять же поискать модификации с меньшим количеством слоев. Я когда-то решал задачу сегментации с помощью Segnet, находил годную cpu-реализацию (чуть больше информации тут )

Stantin Jun 27 2019 at 16:12

Интересно, изучу

nomhoi Jun 27 2019 at 17:15

Танк маленький, камера слишком низко находится. Размер танка не соответствует размеру дороги.

Stantin Jun 27 2019 at 17:20

Как это мешает?

nomhoi Jun 27 2019 at 17:28

Обученная модель подойдет только для такого размера машин.

Stantin Jun 27 2019 at 17:45

Модели обычно обучают с большой вариативностью по размеру, положению, цвету итд.
Так что низкую высоту камеры эта сеть должна решать (что она в общем-то и делает).

nomhoi Jun 27 2019 at 18:00

Модели обычно обучают с большой вариативностью по размеру, положению, цвету итд.

Так делают все, кто обучает автопилоты?
Это все равно что обычный автомобиль обучать по не размеченному плацу или аэродрому. Чему он там обучится? Не выезжать за пределы плаца или аэродрома?
К тому же, обучать танк ездить только по дорогам — плохая идея :)

Stantin Jun 27 2019 at 18:10

Пока только по тротуару, дальше — по мере роста потребностей.

dkurt Jun 27 2019 at 23:23

У ENet есть одна неприятная особенность, связанная с обучением на Cityscapes — на всех изображениях присутствует фрагмент капота Mercedes, отчего, можно заметить, сеть продолжает выделять на всех Ваших примерах полукруг как background внизу кадра.

Stantin Jun 27 2019 at 23:36

Да, сомнительно вот здесь же нет

dkurt Jun 29 2019 at 00:16

Ну как бы есть же, чем иначе объяснить влечение сети оставлять пиксели снизу, но не слева, например?

Stantin Jun 29 2019 at 00:35

Может быть и ваша правда, я списывал это на неоднородность асфальта.

xaoc80 Jun 27 2019 at 19:05

Я для своих экспериментов просто использовал вот этот проект github.com/kwotsin/TensorFlow-ENet
Все работает из коробки с CamVid, при этом разрешение картинки можно задать в настройках (я потратил минут 20 на все), можно скачать предобученную модель.
Можно использовть свой датасет.

Но, если хотите высокий FPS возьмите модель Road Segmentation из openVino и используйте ее, она хорошо обучена и очень быстрая (у меня на одном ядре I7 работает в реалтайме, правда с Inference Engine). Не знаю, работает ли IE на вашей платформе, но если работает, то 3-4 fps должна выдать. Эта модель больше подходит для вашей задачи. Крмое этого, можете в модели уменьшить число классов до 2-х, этим вы сократите расходы времени CPU на обработку не нужных вам feature maps и тогда сеть будет работать быстрее. В репозитории OpenVino Zoo есть и варианты с int8 моделями, которые на CPU работают еще быстрее.

Stantin Jun 27 2019 at 19:19

интересно, спасибо. Этот проект не попался изначально.

dkurt Jun 27 2019 at 23:17

Все же автор использует Raspberry, где ARM CPU. OpenVINO подойдёт разве что для запуска на Movidius (ну или попробовать OpenCV оттуда, вдруг забыли какие-то флаги оптимизации выставить). Поэтому вариант с уменьшением размеров картинки в несколько раз, как по мне, пока наиболее перспективный.

Stantin Jun 27 2019 at 23:44

К сожалению, Интел так документирует свои продукты, как будто преследует цель, чтобы ими никто не пользовался. Так что про Road Segmentation сразу не понял.

dkurt Jun 29 2019 at 00:08

На всякий случай,
Описания: https://github.com/opencv/open_model_zoo
Сами модели: https://download.01.org/opencv/2019/open_model_zoo/R1/models_bin/

Stantin Jun 29 2019 at 00:36

Будет что поизучать, спасибо

xaoc80 Jun 28 2019 at 00:27

Пользуясь случаем хочу спросить насчет предобученных моделей Intel Zoo. У меня наблюдалось некоторое ускорение int8 моделей по сравнению с fp32. Там есть какие-то оптимизации для CPU вроде SIMD или у меня наблюдался эффект ускорения, связанный с уменьшением модели и более эффективным использованием кэша? На каких датасетах эти модели обучали? Можно ли взять модель, обучить на своем, а потом при помощи Model Optimizer сделать оптимизированную модель и запустить на IE?

dkurt Jun 29 2019 at 00:03

Я бы сказал, что ускорение даже должно быть. То, что вес модели меньше в 4 раза — это хорошо, но не главное.
Модели обучаются в FP32 режиме — для создания INT8 веса квантизуют, с учетом активаций нейронов (назвали калибровкой). Потребуется 1-2 тысячи картинок-примеров из вашей задачи, чтобы собрать статистики.

Foreglance Jul 7 2019 at 12:22

Просто для информации (упоминался DonkeyCar) — Amazon запустил проект/сообщество AWS DeepRacer. Примерно похожая задача. Только трассы предопределённые.

Stantin Jul 7 2019 at 19:54

Насколько я помню, у него все расчеты в облаке AWS должны быть.

Show the best of all time