worker_sam Dec 22 2019 at 22:29

Использование сверточной нейронной сети для игры в «Жизнь» (на Keras)

10 min

11K

Machine learning *

From sandbox

+25

Comments 23

sgjurano Dec 23 2019 at 01:23

Отличная статья, спасибо!

Глаз зацепился за padding='same', я даже собрался вам написать об ошибке на краях, а у вас дальше такой классный разбор :)

worker_sam Dec 23 2019 at 09:34

Это перевод. Делал сам нечто подобное. С padding='same' точность достигает порядка 91%. Не знаю, как автор получил 98%.

Closius Dec 23 2019 at 01:49

Хм… а сможет ли сеть делать предсказания на несколько шагов вперед за время выше чем классический алгоритм игры жизнь?

worker_sam Dec 23 2019 at 09:35

За время меньше? Теоретически — да. Если скорость предсказания выше (например, за счет аппаратуры, когда сеть на GPU, алгоритм на CPU, либо за счет оптимизаций), а пересчет всего поля сетью ведется параллельно.

Ivan_Gudoshnikov Dec 23 2019 at 05:55

Моделировать такой простой детерминированный алгоритм нейросеткой — это как то грустно, хотя я и не специалист чтобы судить.
А если попробовать скармливать в обучающем наборе последующий шаг как input и требовать от нейросети предыдущий как output?(тогда наверное все поле должно быть в качестве input layer). Получится ли таким способом искать сады Эдема?

worker_sam Dec 23 2019 at 09:38

Моделировать такой простой детерминированный алгоритм нейросеткой — это как то грустно, хотя я и не специалист чтобы судить.

Смотрите эпиграф.

А если попробовать скармливать в обучающем наборе последующий шаг как input и требовать от нейросети предыдущий как output?

Имеется ввиду, предсказывать временной ряд?

(тогда наверное все поле должно быть в качестве input layer). Получится ли таким способом искать сады Эдема?

Не знаю, сам не занимался, статей на эту тему не видел, и сам этот клеточный автомат вижу первый раз, почитаю, спасибо за наводку.

lightcaster Dec 23 2019 at 12:58

Было соревнование на кагле по инвертированию игры: www.kaggle.com/c/conway-s-reverse-game-of-life/overview/description
Но не сказал бы что что-то интересное или прорывное там было.

Pochemuk Dec 23 2019 at 17:29

Инвертирование не является однозначным. Т.е. у одной фигуры может быть несколько различных потомков.
Как в таком случае будет вести себя ИНС — не знаю. Но что-то подсказывает мне, что ничего хорошего не выйдет.

amazed Dec 24 2019 at 00:01

Сама по себе задача довольно интересна. Можно создавать случайные миры, запускать их до стабилизации а потом обучать сеть на записи обратного развития.
Интересно здесь следующее. На самом деле игра жизнь необратима, но ходу развития автомата, на неком этапе развития ему всегда свойственны определенные паттерны со своими вероятностями.
Если сеть будет очень хорошо знать все эти паттерны, она сможет довольно точно предсказывать прошлое для необратимого автомата.
Если это действительно возможно, то тогда возможны интересные аналогии с физикой реального мира, которая тоже вроде-бы обратима, хотя один из базовых принципов квантовой механики необратим…

Temmokan Dec 23 2019 at 07:11

Правила продолжают применяться рекурсивно

Рекурсия — это всё же вызов функцией самой себя («Рекурсия: см. Рекурсия»). В данном случае просто повторное применение правил, чтобы получить новое поколение.

worker_sam Dec 23 2019 at 09:40

Исправил.

viktprog Dec 24 2019 at 08:38

Состояние задается рекуррентной формулой

state(T) = transition(state(T - 1)), state(0) = state_0

Функция state(t) вполне себе рекурсивная

alexander-shustanov Dec 23 2019 at 09:18

А почему filters=50? Как подбирался этот параметр? Что-то мне подсказывает, что можно сильно меньше взять, без просадки точности. Тоже и к другим параметрам относится.

worker_sam Dec 23 2019 at 09:42

Напомню, что это перевод. Но параметр, вероятно, подбирался эмпирически. Некоторые параметры очевидно, почему такие, например размер ядра 3x3 — потому, что клетка в центре зависит от соседей по бокам.

Pochemuk Dec 23 2019 at 20:16

А метка «Перевод» не указана. Поэтому создается впечатление, что это собственная наработка.

worker_sam Dec 24 2019 at 08:43

Добавил.

arTk_ev Dec 23 2019 at 20:12

А сразу на несколько шагов сеть может предсказать, без промежуточных шагов?

worker_sam Dec 24 2019 at 08:43

Да, но это уже является предсказанием временного ряда, и количество пропущенных шагов сетки зависит от того, насколько сдвинуто окно предсказания: там есть свои особенности.

stasiche Dec 24 2019 at 08:38

Решение самой «Жизни» есть куда более красивое) Взято с

def iterate(Z):
    # Count neighbours
    N = (Z[0:-2,0:-2] + Z[0:-2,1:-1] + Z[0:-2,2:] +
         Z[1:-1,0:-2]                + Z[1:-1,2:] +
         Z[2:  ,0:-2] + Z[2:  ,1:-1] + Z[2:  ,2:])

    # Apply rules
    birth = (N == 3) & (Z[1:-1,1:-1]==0)
    survive = ((N == 2) | (N == 3)) & (Z[1:-1,1:-1] == 1)
    Z[...] = 0
    Z[1:-1,1:-1][birth | survive] = 1
    return Z

vovak1919 Dec 24 2019 at 08:39

Что такое model.predict_classes? Не нашел описания на сайте keras.io. Я так понял, статья довольно старая, т.к. на том-же keras.io и в книге самого Шолле активация уже не выделяется в отдельный слой, а передается параметром слоя.

worker_sam Dec 24 2019 at 08:41

Что такое model.predict_classes? Не нашел описания на сайте keras.io.

https://kite.com/python/docs/tensorflow.keras.Sequential.predict_classes

Я так понял, статья довольно старая, т.к. на том-же keras.io и в книге самого Шолле активация уже не выделяется в отдельный слой, а передается параметром слоя.

Нет, вывод неверный. Статья от 02.2019. Активацию возможно указать без отдельного слоя года с 2016, если не ошибаюсь, тут видимо привычка.

pdima Dec 24 2019 at 10:56

Похоже либо пропущена нелинейность либо промежуточный слой лишний:

model.add(Dense(hidden_dims))

model.add(Dense(1))

без нелинейности после первого уровня оба уровня заменяются одним Dense(1)

worker_sam Dec 24 2019 at 20:23

Да, похоже вы правы. Без нелинейности два слоя возможно свести к линейной функции, которую может представить и один слой. Разве что, параметров больше.
Но у автора так, видимо он забыл.
Добавление активации (например, 'tanh') немного улучшает качество предсказания.