Comments 5
UFO just landed and posted this here
реальное применение для генерации «умного» ИИ для игр или для тестирования уровней, нахождение багов и дизбаланса и тп
0
Всё сильно зависит от задачи. При правильно настроенных параметрах, простые задачки типа достижения заданных координат на поверхности агенты самостоятельно начинают выполнять через 150-200 тыс итераций обучения (шагов, steps в терминологии tensor flow), время тут измеряется минутами при большом числе одновременно обучающихся агентов. В комплексной среде и со сложными задачами (например, когда на входе не raycast сигналы, а видео), это миллионы итераций и часы/дни обучения. Извините, наверное тоже слишком поверхностно, но это не то что в рамках комментария, в рамках целой статьи сложно подробно изложить.
0
UFO just landed and posted this here
Sign up to leave a comment.
Обучение умных игровых соперников в Unity методом «игра с самим собой» средствами ML-Agents