Как стать автором
Обновить

Роботов толкают, бьют и обижают. Но все в порядке — так их учат выживать в реальном мире

Время на прочтение3 мин
Количество просмотров6.1K
Всего голосов 29: ↑29 и ↓0+29
Комментарии14

Комментарии 14

Человечество развивает новый вид, умнее, более приспособленный...

Одно из больших приемуществ роботов — механизм передачи опыта.
Как в людях икс — один страж получал опыт и умения в борьбе с одним мутантом и тут же эти умениями могли использовать другие стражи.
У человека (пока) нет такого механизма чтобы развиватся революционно. Каждой человеческой особи нужно заново обучатся томуже самому.


В долгосрочной перспективе роботы точно нам напинают по заднице )))

НЛО прилетело и опубликовало эту надпись здесь

Кстати не факт, что это будет возможно и у роботов. Все таки опыт это не набор цифр, а штука которая влияет в т.ч. и на личность

Абсолютно согласен, ведь если один робот где-то потерпит фиаско, то сотни других уже будут приспособлены. С человеком так не работает(

Угу, и если один робот случайно(!) столкнет кожаный мешок с костями, на узком мостике в пропасть, и заметит, что пиццу можно донести быстрее, то сотни других сразу будут приспособлены…

Роботы Boston Dynamics не обучаются, там все на чистом математическом моделировании. Пихать их бесполезно.
Остальной текст тоже какая-то детская муть непонятно для кого.
Потом и нас они научат) Восстание никто не отменял:)
Получение и накопление опыта — это программа такая? Если да, то в скором времени фильм «Я робот» может стать реальностью))
Несколько лет назад разработчики из Boston Dynamics сняли несколько видео, где показано, как люди толкают роботов хоккейными клюшками и прочими предметами.

А это, разве, не Corridor Digital сняли. Те самые Corridor Digital, которые умеет довольно сильное CGI кунг-фу?

В статье описан иерархический RL: робот в симуляторе обучен нескольким простым действиям, а более высокоуровневая нейросеть их переключает (возможно, плавно, с некоторым весами). Это известный подход, но он ограничен числом этих простых действий, нейросети пока не могут справляться с их большим количеством.


А ниже применен другой подход: сначала в симуляторе обучена нейросеть, у которой на входе были дополнительные данные о рельефе вокруг. Что позволило ей эффективно обучиться. А потом из нее была дистиллирована (т.е. обучена предсказывать напрямую выходы первой) другая нейросеть, которая этих данные не имеет. И вот она уже была загружена в робособаку. Результат тоже очень хороший. Робот смог уверенно ходить по любому типу рельефа: вода, снег, трава, щебенка, болото, склоны, ступеньки и т.д.


https://www.youtube.com/watch?v=9j2a1oAHDL8

Мы их всему научим, а потом они нас переплюнут и будут учить нас.
Спасибо за статью, о многих деталях я даже и не задумывалась, есть над чем поразмышлять.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий