Yaraife Feb 12 2011 at 01:42

Sony SCL — эксперимент «игровая площадка»

3 min

791

Artificial Intelligence

+22

Comments 28

Yaraife Feb 12 2011 at 01:49

1) Я думаю что этот способ, как минимум, найдет свою нишу, где необходимо разнообразие и самостоятельное обучение без помощи человека. Либо в тех областях где необходим высокий уровень адаптации. Либо для повышения живучести, для того, чтобы робот мог сориентироваться в случае, если получит серьёзные повреждения.

2) Думаю, что если он и может считаться осмысленным, то только частично, потому что пространство событий в таких условиях очень ограничено и робот мог вполне перебрать их всех, хотя допускаю что это было сделано для сокращения потраченного на эксперимент времени.

3) Мне кажется, что эксперимент был вполне успешен. Не смотря на небольшой выбор действий, робот смог составить последовательность действий, научился поворачивать голову с сенсорами в ту же сторону, где будет совершаться действие и достаточно точно определять расстояние до цели.

Rafael_Delon Feb 13 2011 at 00:26

Подумалось: Интересно же почувствовать себя на месте Бога (что он чувствует когда следит как развивается человечество) и посмотреть как развивается этот робот. ;)

amarao Feb 12 2011 at 02:07

Мне кажется, разработчики совершают страшную ошибку. Если роботам будет интересно исследовать, то человечеству так и придётся всю жизнь торчать менеджерами по продажам. А всё интересное достанется роботам.

Негодуэ.

-3

Yaraife Feb 12 2011 at 10:50

Пока мы были мелкими, все интересное доставалось нам, возможно, пора передать эстафету.

Guria Feb 12 2011 at 09:46

У вас фраза на полуслове обрывается:

Второй модуль — система метапрогноза, цель которого — предсказание ошибок первого модуля. Он основан на том,

Yaraife Feb 12 2011 at 10:48

Задумался видимо, когда писал. Исправил.

VitaZheltyakov Feb 12 2011 at 09:48

Такие методы — «Обучения роботов», используются давно.
Сами по себе алгоритмы обучения простые. Основная проблема заложена в технической реализации — мало разнообразных сенсоров, дающих достаточно полную информацию и той ситуации, в которую попал робот; и нехватка памяти для запоминания всей «полезной» информации.

kirsan_vlz Feb 12 2011 at 09:59

С памятью проблему может решить робовики, про которую недавно писали. Мне кажется, что при грамотном подходе это может стать прорывом.
Только вопрос с безопасностью тех данных, которые будут в той вики. Мало ли что туда ~~скайнет~~ кто-нибудь запихнёт.

Yaraife Feb 12 2011 at 10:56

С памятью сейчас проблем нет, винты на терабайт уже не редкость. При достаточно грамотном подходе это чуть ли не бесконечный объем для информации.

Проблема скорее в базовых умениях, таких как распознавание обьектов, ин- и дедукция, сравнение, мотивация.
Пока этих умений нет, общаться с кем-то, включая робовики, сложно, когда они появятся робовики будет не так важна, потому что нужную инфомрацию робот будет в состоянии найти сам.

kirsan_vlz Feb 12 2011 at 09:56

1) Да, конечно имеет. Лично мне кажется, что это может сильно расширить возможности ИИ. Вот всегда, при попытке создать интеллект вроде человеческого, разработчики стремятся сделать его сразу готовым. но даже человек с его мозгом, который мощнее и развитее нынешних компьютеров по части обработки аудиовизуальной информации, сколько лет изучает мир вокруг себя пока делает первые шаги или говорит первое слово? И я считаю, что роботов, чтобы создать у них хоть какое-то подобие интеллекта, нужно также обучать. В общем-то с нейронными сетями сейчас так и делают.

2) Может. В любом случае, это первые шаги. которые покажут перспективность всего направления в целом. Если этот опыт признают успешным, то что мешает в дальнейшем давать роботу больше свободы над своим телом?

3) Думаю да. Робот же научился делать некоторые самостоятельные действия.

Вообще. конечно, убрать бы вообще все предустановки. т.е. так, чтобы робот мог даже попытаться прыгать на одной лапе, не умея при этом ходить. И запустить самообучение на управление собственным телом, постепенно усложняя задачи.

Недавно, кстати, была тут новость про создание роботовики. Если каждого такого робота стандартизировать и подключить к единой базе знаний, то процесс познания пойдёт в разы быстрее. Общее развитие роботы получат вместе, а потом для конкретных задач можно обучать по группам. Что примечательно, глядя на сегодняшние достижения в робототехнике и изучении алгоритмов ИИ, такая затея вполне может вылиться в более-менее приемлемый псевдоинтеллект, который можно будет охарактеризовать как ОС для роботов :)

Yaraife Feb 12 2011 at 10:47

Если в проекте использовалась нейронная сеть, то использование каких-либо внешних источников информации с самых азов крайне затрунительно. Для сети информация = собственное состояние, и изучить что-то новое можно только переписав(часть) себя.

А варианты как можно хранить информацию для нейросетей, кроме как примерами этих самых нейросетей я не представляю, потому что языка общения с ними не существует.

Т.е. для общения с вики робот должен мочь сформулировать однозначный вопрос и каким-то образом его усвоить.

П.С. Спасибо за ответы

kirsan_vlz Feb 12 2011 at 11:28

Вики можно сделать как центральную нейросеть для всех роботов. Единая база знаний, которая получает опыт всех роботов и суммирует его.
Я представляю себе такой алгоритм:
1) Робот что-то распознаёт/делает/etc…
2) Массив входных данных запоминается.
3) Если действие успешно (не забываем, что начальное обучение проходит по принципу «можно/нельзя»), то массив данных подаётся на центральную нейросеть и в ней происходит обучение.
4) При создании новых роботов их «мозги» берутся не с нуля, а как слепок центральной нейросети.
Таким образом каждый робот учится отдельно, но при этом центральную базу знаний развивают все роботы вместе и новые поколения получают себе общее знание, которое далее улучшают.

Самый сложный момент во всей этой затее — архитектура нейронной сети. Т.к. я полагаю, что во-первых, она должна ветвиться, т.е. визуальная информацию обрабатывается одной сетью, аудио — другой, тактильные ощущения третьей. Потом результат подавать на центральную сеть, которая отвечает за принятие решений. И в зависимости от решения формировать последовательность действий на уровне сигналов «конечностям».
И при этом сетка должна получиться не слишком громоздкой, чтобы эти «мозги» можно было поставить на каждого робота, а не только на того, который проводом прицеплен к датацентру )

Yaraife Feb 12 2011 at 11:46

Для любой НС, сложнее робопылесоса, при прямой передаче, траффик будет исчислятся в Мб\сек.
Обучение по принципу можно\нельзя слишком просто и имеет свои границы.
Вероятнее всего, что в будущем будет использоваться более мягкий и в тоже время менее предсказуемый алгоритм.
НС сложно маштабировать. Построить действущую центральную НС на многие порядки сложнее чем робособаки.

kirsan_vlz Feb 12 2011 at 12:20

Вот если научатся создавать НС, которые сами себе нейроны и связи между ними создают по необходимости, тогда может быть что-то и получится из этой затеи. Но я себе даже не представляю, с какой стороны к подобной задаче вообще можно подойти.
Можно/нельзя — это первичное. Дети также учатся. Дотронулся до утюга — горячо, нельзя.
Мне кажется, что в будущем вообще что-нибудь ещё изобретут либо в железе, что позволит работать с подобными объёмами информации, либо в алгоритмах, что позволит эти самые объёмы уменьшить.
Хотя тоже недавно статья была, где каким-то образом нейроны из мозга крысы скрестили с роботом. Может и в этом направлении что-то будет.

Yaraife Feb 12 2011 at 12:30

* self-mapping + recurrent neural network- один из самых сложных типов сетей для прогнозирования, для них не доказана математическая сходимость, для них сложно применять алгоритмы обучения типа обратного расспространения ошибки.
* Для того, чтобы создать простые релексы типа «больно-сделай по-другому и запомни» придется очень долго насиловать генетические алгоритмы. Это не свойство НС по факту, это эволюционный механизм, способствующий выживанию.
* В будущем…
* В том эксперименте нейроны жили до 3ех месяцев. Живые нейроны не очень хорошо работают с нашими кремне-металлическими технологиями, с живых нейронов нельзя снять копию, и даже если мы на их основе построем ИИ это мало приблизит нас к пониманию того, как собственно ИИ нужно строить.

andrewsh Feb 13 2011 at 00:53

> RISK

RISC, поправьте, пожалуйста.

Yaraife Feb 13 2011 at 02:02

Исправлено

arkady Feb 13 2011 at 03:28

> работает 1.5 часа

Начать надо было с того что умеют даже пылесосы — самостоятельно отправляться на базовую станцию для подзарядки. Как никак — основной инстинкт, а инстинкты надо закладывать, а не ждать пока сам додумается

Yaraife Feb 13 2011 at 12:08

Робот пока ещё ходить не умеет, думаю поэтому это было бы проблемой

Zardos Feb 13 2011 at 04:34

Для того чтоб обучение было успешным необходимо, чтоб роботу было интересно то что он делает. Т.е. он должен видеть, как его действия (которые он может запомнить как причину полученного эффекта) приводят к результату, который ему нравится. Думаю, что запрограммированной мотивацией можно было бы поставить увеличение разных штук через разные последовательности действий, которые в принципе он может провернуть или построить. Это может относиться как к собственным степеням свободы (в том числе в виде последовательностей разных движений), так и к реакциям окружающего мира на эти свои действия или просто изучению того что происходит вокруг без собственного участия. При этом хорошо бы научиться отделять автономные события внешнего мира от реакций на собственные действия. Тогда может родиться модель «Я», как виртуальный объект на который завязаны собственные действия и отклик на них от окружающего мира.

Yaraife Feb 13 2011 at 12:13

По-моему именно по такой схеме он и был устроен. Робот пытался выполнить действия пока не получал ответную реакцию от окружающей среды, т.е. можно сказать он добивался ответной реакции.

Разве что в данном случае желаемая реакция окружающей среды (изменение) была, скорее всего, запрограммирована.

Насчет «нравится» — это очень сложное понятие. Допустим это можно расписать для «поесть» и «не упасть», но что-то сложнее описать таким способом уже сложно. На мой взгляд это не самый удачный метод.

Gibbzy Feb 13 2011 at 06:17

«обладает 20 степенями свободы»
Похоже на Русскую демократию

-1

VovixLDR Feb 13 2011 at 11:22

Как это Sony разрешило такое неавторизованное использование своего продукта?

Yaraife Feb 13 2011 at 12:18

Sony Computer Science Laboratory(Sony SCL) — это подразделение компании Sony. Их продукт и их ученые.

rrock Feb 13 2011 at 12:06

Судя по последней фотки Sony готовит замену Чаку: на данной фотке Aibo нам демонстрирует знамениты удар ногой с разворота.

kkot Feb 13 2011 at 18:54

прочитал про роботвики в комментах и мне стало страшно…

kkot Feb 13 2011 at 19:00

Ну, конечно до этого страшного момента еще время должно пройти в развитии ИИ… Где-то я читал про эксперимент с ИИ у робота, который покончил (причем была серия опытов) свою электронную жизнь самоубийством — лишал себя аккумулятора с завидным постоянством, представляете… А вы говорите роботвики…

Yaraife Feb 13 2011 at 20:06

Хорошие пример. Инстинкта самосохранения у роботов изначально нет, и выработать его очень сложно. В итоге робот просто из любопытства совершает это действие(вытащить аккумулятор), и будет делать до тех пор, пока не сложится правило, которое это как-либо запрещает делать.

Show the best of all time