Как стать автором
Обновить
10
0
Павлухин Михаил @Nicknameless

Data Scientist

Отправить сообщение
Я сперва подумал, что это будет тест аля «кто ты из смешариков?»
Изначально я так и делал
Учил только линейный слой эволюцией, что тоже работало. При этом даже работало с необученными свертками
Формулу взял из статьи OpenAI Evolution Strategies as a Scalable Alternative to Reinforcement Learning
Думаю действительно стоит проверить на какой-то части лучших потомков
Спасибо за совет
Так они этот алгоритм еще в прошлом году выпустили (ссылка на статью)
И за этот год никакого бума не случилось
Спасибо за такой подробный комментарий, будет что изучить (так как я недавно только начал изучать теорию игр).
Согласен, мне было больше интересно посмотреть как ведут себя люди в этой игре, попробовать найти какие-то закономерности в их стратегиях.

Ну тут скорее дело во мне, а не в нейронке
Так как я обучал:
Есть две одинаковых модели, они генерируют матрицы 3х3, считаем скор по ним (кол-во занятых клеток плюс ничья), по нему обновляем их веса. Мне кажется, что ошибка в функции потери у меня

Я как раз сейчас пишу статью для хабра по результатам игры. Надеюсь сегодня выложить ее.
Посмотрим
Возможно, еще буду запускать подобные игры

Сегодня выложу топ 100 лидерборд.
Было бы интересно послушать про метрики.

Изначально я хотел, чтобы каждый с каждым играл при отправке, но при таком кол-ве участников пришлось бы очень долго ждать, пока все результаты запишутся в БД. Согласен, что метрику реал тайм лидерборда нужно поменять, и если я буду еще запускать подобные игры, то обязательно над эти поработаю
Привет
Да, я хожу на этот факультатив, но за честность можешь не переживать
Я уже отправил свое решение. Отправлять лучшее решение как домашку нет смысла, так как вряд ли оно будет лучшим внутри факультатива. (у этой игры оказывается нет идеального решения)
Я сделал это, потому что мне это действительно интересно

Может когда-нибудь на кагл завезут продакшн соревнование, где будет оцениваться не только скор, но и вес и скорость выполнения модели. Было бы круто и интересно

Ага, видел. Классная реализация

Да, вы правы.
Нашел как называется такой тип задач «Игра полковника Блотто». Действительно здесь нет идеального решения. Тогда просто интересно узнать как будут отвечать люди, может выделить какие-то зависимости. Придумаю, когда увижу данные. Основная цель была — сделать что-нибудь прикольное и интересное, и пока все идет по плану.
ага, спасибо за совет. Только что обнаружил, что так можно накручивать (чем 20 человек и воспользовалось, но я сам виноват)

Так как это конечная игра (у игроков есть конечный набор стратегий), то здесь соблюдается равновесие Нэша, что значит — существует такое решение, при котором как бы другие игроки не меняли свои ответы, они не смогут увеличить свой выигрыш. Хотя здесь возможна ничья, так что насчёт этого я не совсем уверен, надо будет поизучать еще материалы по этой теме. Но какое-то идеальное решение в теории здесь должно существовать

Защиты от этого нет, так как она здесь не нужна. В реал тайм лидерборде выбирается 10 случайных оппонентов для решения, не факт, что именно те самые попадутся. При финальном подсчёте, если эти 1000 решений будут проигрывать только одной стратегии, то это будет очень круто и интересно, в противном случае они будут также поднимать счет и других игроков.


Но кстати при проверке финальной можно будет также прогнать только на уникальных стратегиях

Выглядит прикольно! А планируете добавить Go?

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность