Batch Normalization для ускорения обучения нейронных сетей / Comments / Habr

ZlodeiBaal Sep 6 2016 at 17:30

Скажите, а текущую версию в каффе пробовали? Просто какой-то странный уж очень график получается у вас на последнем кадре. Не видел такого эффекта.

ternaus Sep 7 2016 at 04:06

Тут можно много с чем поиграться для увеличения скорости сходимости, например различные optimizers ведут себя по разному. К примеру Adam часто сходится быстрее, чем SGD.

Или, например, функции активации. Существует целый зоопарк в семействе Relu => Elu, Prelu, LeakuRelu, etc, и авторы каждой утверждают, что их activation function точно лучше и часто оно так и есть. Мне нравиться использовать Elu.

Или использовать MaxOut layers.

Или попробовать другую архитектуру сети.

Или с аугментацией поиграться.

Кстати, то что при добавлении Batch Normalization сеть в память не влезает можно обойти уменьшив размер батча.

Parilo Sep 15 2016 at 00:34

Уменьшение размера батча также даст уменьшение времени итерации обучения, что опять же может ускорить обучение. Однако надо следить, чтобы при этом не падало качество обучения.

Batch Normalization для ускорения обучения нейронных сетей

Comments 3

Articles