Geotyper Jul 19 2018 at 22:45

Создание бота для участия в AI mini cup 2018 на основе рекуррентной нейронной сети (часть 2)

12 min

5.8K

Programming*Cybersport

Tutorial

Comments 8

vesper-bot Jul 20 2018 at 10:47

Not bad :)
Как я понимаю, последний нейрон нужен для нормировки выходного сигнала из каждого нейрона, потому как в сети «сколько вошло, столько вышло», а при адаптации требуется, чтобы вышло больше или меньше, и в последний нейрон просто сливается избыток сигнала.

PS: метки разделяются запятыми, у вас две в одну слились в результате.

Geotyper Jul 20 2018 at 12:26

Not bad, безусловно лучше чем Not good, спасибо.
Если ответ про задачку о лишнем нейроне, то неверная интерпретация.
С форматированием текста пока тяжело получается, здесь Вы правы.

UFO just landed and posted this here

Geotyper Jul 20 2018 at 12:28

Вопрос немного вперед моего повествования, там третья часть намечается. Но если коротко, то в данной статье упоминалась фитнесс функция. Вот она и влияет на селекцию.

ser-mk Jul 20 2018 at 18:22

Не покидает ощущение что читаешь перевод или пересказ, везде автор ссылается на себя в третьем лице.

В интернет группах разработчиков ботов, звучало мнение: дайте нам log файл в виде координат ботов и другой игровой информации для формирования библиотеки примеров. Но автор к сожалению так и не смог догадаться, как этот log файл использовать для обучения NN.

Если в логах есть запись действия лидера с хорошей тактикой, то наврено там планировалось использовать его для обучения методом backpropagation. Т.е. сравнивать действия сети и дейтсвие игрока и вовремя бить сеть по рукам если она делает что-то отличное. Но это мнение дилетанта.

cudaRNN — так понял просто просчитывает сеть, для входных значений и выдает некий результат. В CUDA тоже дилетант: поэтому вопрос зачем пришлось с ней так заморачиваться? чем это лучше реализации на С/С++. Если это делалось для симуляции игр, то вам получаетя требуется и саму игру тащить в GPU.

Geotyper Jul 20 2018 at 19:22

По поводу пересказа наверное верное слово, хотелось выбрать нестандартный стиль общения, не более того. Но местами путался сам: где автор, а где от первого лица. Одним словом Мы, я и читатель)
На третий пункт проще ответить, третья часть статьи как раз об этом. Как все пришлось переносить на GPU, нейросеть, генетический алгоритм и конечно сам алгоритм игрового процесса. Но начинал честно с c# потом с++ и CUDA, просто в c# к ней прямого доступа нет. Есть сторонние библиотеки но проще уж перейти на с++, хотя до этого ни Куду, ни плюсы не использовал.
Второй пункт, здесь поле для полемики, проще ответить: лучше один раз увидеть ) Но думаю, что в любом случае не так прямолинейно скармливать и потом корректировать. А может так и надо делать. Вопросы: корректировать каждый Тик когда сеть ошиблась? Что будет примерами для обучения, одно движение или траектория? Если кто знает как это устроить, готов услышать.

UFO just landed and posted this here

Geotyper Jul 20 2018 at 21:42

Для отдельных операций на отдельных сетях нужен будет арбитраж, например рядом еда, бот который еда, стенка и два больших бота. Здесь более менее понятно, что нужна одна нейронка. Хуже дело обстоит если бот делится, непонятно становится кем нейронка управляет? там тоже арбитраж нужен в части принятия решения.
А про эмуляцию мира и другие моменты как раз третья статья.

Show the best of all time