Как стать автором
Обновить

Комментарии 8

Я мало что понимаю в нейронных сетях, чтобы критиковать само решение. Но мне кажется, что свою домашнюю работу вы не доделали. Ну вот смотрите:

>Я посчитал верным решением обучать нейросеть не на исходных изображениях, а на изображениях с контурами автомобиля, найденными посредством функции cv2.findcontours(...).

Резонно, но: если бы вы довели свою идею до результата, то есть, провели бы обучение двумя способами, и сравнили бы качество распознавания, вы бы реально извлекли что-то полезное из своего эксперимента, и возможно что не только для себя.

Ну или вот тут:

>Архитектура сети списана с примера с интернетов: для меня неочевидно объяснение, почему именно так.

Опять же, домашняя работа не завершена. Нормальный вариант выглядел бы так: архитектура взята вот тут (ссылка), там она применяется для решения похожей задачи (почему вы или автор архитектуры считаете, что они похожи), с хорошими результатами. А так вообще непонятно, что за архитектуру вы взяли, и почему именно ее?

Ну и кстати, ваши-то результаты где? Каково качество, быстродействие, какие-то еще показатели? Оно вообще работает?
Спасибо за комментарий

Насколько я понимаю, многослойный полносвязный персептрон совершенно не используется для распознавания изображений. Возможно, я бы получил лучшие результаты, использовав бы сверточную архитектуру, которая применяется повсеместно для анализа изображений.

Мой интерес состоит в том числе и в том, насколько просто использовать простые структуры: в нейросети сравнительно мало нейронов(этим объясняется высокое быстродействие), однако она работает с 80% точностью(для кадров разнесенных во времени). Работает это только потому, что я анализирую не сами изображения, а найденные алгоритмом контуры

Подобный подход к решению задачи классификации изображений(персептрон) я увидел в примере из документации tensorflow(они классифицировали MNIST датасет, черно-белые картинки 25х25 пикселей с изображениями разных видов одежды).

А цель проекта какая? Можно сделать полезное приложение, если находить свободные места на парковке.

О, я над похожей задачей работал некоторое время для личных целей. Основная проблема была в том, что автолюбители не брезгуют ставить автомобили не по разметке. Ставят криво, поперек, по диагонали: кто как сумел. И, т.о., задача сводилась к тому, чтобы посчитать расстояние между стоящими автомобилями и определить, хватит ли его для парковки еще одного автомобиля. Я делал без нейросетей, в каком-то виде все работает, но ключевым моментом осталось требование: камера должна быть правильно установлена.
У меня задача попроще: парковочное место — личное, машина ставится всегда одинаково, и никто кроме одной машины там не появляется
Вероятно, можно было бы справиться и без нейросети, но целью и лейтмотивом затеи являлось изучение, пусть и поверхностное, возможностей данного метода
> Если знающие люди расскажут или подскажут где почитать, почему эта архитектура эффективна или почему какая-та другая будет эффективнее, буду безмерно благодарен.
Для распознавания изображений лучше использовать свертчные сети (почитай как они работают например VGG, ResNet и тд)
Но вобще непонятные твои результаты, есть ли что улучшать или нет
Спасибо, почитаю
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.