alizar 19 янв 2017 в 00:13

Домашнее задание от МТИ: пишем нейросеть для манёвров в дорожном трафике

4 мин

23K

Искусственный интеллект

+27

Комментарии 32

newis 19 янв 2017 в 07:37

Антон, обгоняй уже Лекса.

artoym 19 янв 2017 в 09:17

На данный момент с 75,04 вышел на первое место.

Jeiwan 19 янв 2017 в 10:57

Меж тем Антон уже вышел на первое место с большим отрывом:

https://habrastorage.org/files/d5e/a53/d9f/d5ea53d9f80a4e068670373a22537961.png

NINeOneone 19 янв 2017 в 11:45

«Это все русские хакеры!»

alek0585 19 янв 2017 в 16:52

Я был большего мнения о преподавателях МИТ… А тут какой-то Печенко из ниоткуда показал лучшие результаты.
Респект нашим!)

-3

shadowkas 19 янв 2017 в 11:56

что то кажется все таки с нейронами играть нельзя ибо слишком просто получается.

Jeiwan 19 янв 2017 в 12:26

Набрал 71.32 на дефолтной модели, увеличив область видимости и количество нейронов на fc-слое. Больше набрать не получается, наверное надо менять архитектуру сети.

Кстати, там ещё есть DeepTesla http://selfdrivingcars.mit.edu/deepteslajs/

El_bruja_de_la_tristefigu 19 янв 2017 в 14:12

69 вышло очень легко — опять же бессистемным изменением параметров и количества нейронов.

roller 19 янв 2017 в 18:53

Как сказать нейросети «Если справа открывается два окна по диагонали — прыгай туда»

Veliant 19 янв 2017 в 22:51

Сделал прямоугольник 3*5 перед машиной, и в learn анализировал три средне-арифметических по каждому из столбцов. Если перед машиной сумма < 1 значит кого-то догоняем. Считаем суммы по соседним рядам. Где сумма больше получается, там и свободнее — перестраиваемся туда. Средняя скорость вышла ~71.5.
Правда при этом не учитывается скорость соседних рядов.
В идеале форма анализируемых клеток должна быть по форме близкая к символам X и V, т.е. приближенная к реальным условиям. Реальный водитель или лидар на три машины вперед врядли сможет видеть

sim31r 20 янв 2017 в 02:51

Лидары теоретически могут соединятся между собой по беспроводной сети и делится наблюдениями, там не так много информации нужно передавать. Таким образом у автопилота будет больше информации, чем у живого водителя.

Sadler 20 янв 2017 в 06:14

5x3 (ШxВ) на расстоянии в 3-4 клетки впереди машины, fc размера 30-50 с relu и 100k итераций дают стабильно в районе 72-72.5. Честно, не очень понимаю, как получить больше, у меня даже при ручном управлении машинкой не выходит 75. Возможно, следует использовать набор conv-слоёв, но в варианте js уж слишком медленно оно работает.

erwins22 20 янв 2017 в 15:04

72 получается если просто увеличить до числа столбцов скрытый слой и убрать из него relu

sviterov 20 янв 2017 в 15:30

А никто не знает, про что график?

Sadler 20 янв 2017 в 16:09

Который красный при обучении? Сравните с lastReward: либо в чистом виде он, либо сглаженный.

sviterov 20 янв 2017 в 17:07

Похоже на средний lastReward за какой-то период

link0ln 20 янв 2017 в 16:21

Не нашел как там фарами поморгать.

Caullerd 20 янв 2017 в 19:35

73 пока максимум, без радикального изменения архитектуры.

Alex20129 22 янв 2017 в 10:39

Игра не так проста, как кажется. Первое, что пришло в голову, это
activation: 'relu'
заменить на
activation: 'sigmoid'
И сработало!

И далее можно добавить скрытых слоёв, просто копируя этот блок
layer_defs.push({
type: 'fc',
num_neurons: 5,
activation: 'sigmoid'
});

erwins22 22 янв 2017 в 11:26

попробывал, 55 получается

пока лучшая идея из простых это убрать активацию на скрытом слое и увеличить его до 5

Alex20129 25 янв 2017 в 05:49

«убрать» не получится. Активационная функция у нейрона есть всегда, без неё он просто не будет работать. В данном случае по умолчанию используется ReLU, если не указано другое.

erwins22 25 янв 2017 в 09:50

точно нет
слой функции активации не отображается и поведение принципиально разное.
тут просто получается линейный классификатор.

Sadler 25 янв 2017 в 18:04

Вот только в Вашей конфигурации нет никакого смысла в линейном слое длины выходного слоя, ибо в результате получается всё та же линейная комбинация входных векторов. С тем же успехом этот слой можете просто убрать.

erwins22 26 янв 2017 в 10:16

Если там 5 и больше, то да, но если там 3 или 2 то происходит сжатие пространства.

Sadler 27 янв 2017 в 13:02

Которое затем просто заново расширяется на выходе. Если бы речь шла о модели энкодера-декодера, это могло бы иметь смысл, а так всё равно бесполезно.

erwins22 27 янв 2017 в 13:33

это работает
10 впереди 2 по бокам, 5 сзади промежуточный слой 3 без функции
72
временныхсрезов =0

Sadler 27 янв 2017 в 15:17

Нет, это не работает. Вы вводите в модель абсолютно нефункциональный элемент. Ничего, кроме замедления расчёта, он не даёт.

erwins22 27 янв 2017 в 15:42

попробуйте.
с ним обучение идет быстро и эффективно.
без него сходимость идет медленно.

Sadler 27 янв 2017 в 15:44

Давайте не будем заниматься здесь алхимией. Если этот слой даёт Вам какие-то преимущества, то у Вас где-то неэффективно работает trainer, возможно, один из других параметров неверен. Другой причины нет.

erwins22 27 янв 2017 в 15:57

Согласен, я написал, что я поменял, можете проверить. причем тут результат достигается очень быстро, так как фактически есть только 2 решения — дернуться вправо или влево.

худший вариант это relu (relu6 был бы в тему, но его нет) так как приходиться делать или большой слой, что бы избежать вырождения или отказаться от него.

tanh ведет себя хорошо и позволяет получить лучшие результаты при долгом обучении.

Линейный вариант при увеличении числа слоев ведет себя также (или немного хуже).

хорошо было бы сделать веток.
простую линейную и нелинейную

erwins22 22 янв 2017 в 12:01

А можно объединять в слой несколько разных функций активации.
Мне такое на тензорфлоу давала лучшие результаты.

Parilo 24 янв 2017 в 12:19

Выложил решение с описанием
текст
видео

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Домашнее задание от МТИ: пишем нейросеть для манёвров в дорожном трафике

Комментарии 32

Публикации

Истории