30 September 2010

Эмоциональный компьютер

Artificial Intelligence
Начнем издалека. Представим себе, что ученые девятнадцатого века неким волшебным образом получили современный компьютер. Они стали бы изучать его работу, создали бы целую науку, описывающую свойства операционной системы и установленных программ. Затем они вскрыли бы этот компьютер и попытались описать его основные узлы, понять их назначение. Потом они стали бы измерять напряжение в различных точках. Возникли бы различные теории о циркулирующих внутри компьютера потоках информации. Возникло бы учение о его кремниевой основе. Кто-нибудь получил бы Нобелевскую премию за открытие принципов работы полупроводникового вентиля. Но самое главное, что сложность устройства современного компьютера затруднила бы тем ученым, путь к пониманию достаточно простых принципов лежащих в основе любой вычислительной техники. Эти принципы были сформулированы в «машине Тьюринга» и не изменились по сей день, и неважно собран ли компьютер на лампах, транзисторах или микросхемах. Любой компьютер имеет память, систему команд, процессор, который умеет эти команды выполнять, программы, состоящие из последовательности команд и устройства ввода вывода, позволяющие взаимодействовать с внешним миром. Остальное «навороты», возникшие в результате эволюции вычислительной техники, хотя и многократно увеличивают возможности компьютера, не отменяют эти принципы.

Изучение человеческого мозга во многом напоминает, нарисованную картину. Мы знаем многое о его внутренней структуре, глубоко изучены процессы, протекающие в нейронах, но для многих исследователей обилие разнообразных знаний, заслоняет понимание достаточно простых принципов лежащих в основе работы мозга.

Зададимся целью создать «мозг» простого устройства, который будет в своем существовании использовать те же принципы, которые присущи живым существам. Конечно, реальный мозг устроен значительно сложнее, но сейчас я попытаюсь сформулировать основной принцип, настолько же фундаментальный для понимания работы мозга, насколько понимание «машины Тьюринга» основополагающе для понимания работы современного компьютера.

В предыдущем посте «Эмоции человека и лампочки компьютера» я описывал роль эмоций и памяти, кратко повторюсь.

Изначально все поступки – следствия рефлексов. Эмоции не «толкают» нас на какое-либо поведение. Эмоции «дают оценку» всему, что происходит. Всегда присутствует итоговая скалярная оценка по шкале «хорошо/плохо». Итоговая оценка фиксируется памятью вместе с «ситуацией», которая вызвала эту оценку. «Ситуации» содержат в себе не только внешнюю картину мира, но и нашу реакцию на нее, наши поступки. Память впоследствии, реагируя на внешнее воздействие, «заставляет» совершать какие-либо действия или «препятствует» им. Причем действия, которые мы совершаем исходя из нашего опыта, с наибольшей вероятностью, в сравнении с другими возможными действиями, будут вести к положительному изменению эмоционального состояния. Эмоции, которые сопровождают наши поступки, нельзя трактовать как «побудители действия», это – оценки происходящего, которые нужны для формирования опыта.



Теперь рассмотрим устройство, изображенное на рисунке.

Каждый из кружочков обозначает некий формальный нейрон — искусственный аналог нейрона реального мозга. За исключением «регулятора», который сам предстовляет из себя несложную конструкцию которую можно собрать из нейронов. В устройстве используется несколько, немного различных по свойствам, типов нейронов. Опишем их:
  • – «Датчики», то есть нейроны, которые получают некую информацию об окружающем мире и находятся в состоянии активности, пока присутствует то раздражение, на которое они реагируют;
  • – «Исполнительные нейроны» – они активируются в том случае, если сумма сигналов входов превышает некое пороговое значение. Активировавшись, исполнительные нейроны приводят в действие связанные с ними исполнительные устройства. При прекращении условия активации нейроны возвращаются в неактивное состояние и прекращают работу исполнительного устройства. Сигналы, приходящие на входы исполнительных нейронов, могут быть активирующие (+1) или тормозящие (-1). Пороговое значение можно сделать зависящим от числа активных входов;
  • – «Рефлексы» – нейроны, связи которых изначально определены. Эти связи образуют матрицу рефлексов. Сами нейроны активируются при возникновении строго определенной картины активности датчиков, причем сочетание активности датчиков, которое к этому приводит, задается изначально. В случае активации рефлексы дают активирующий (+1) либо тормозящий (-1) сигнал исполнительным нейронам;
  • – «Эмоциональные рефлексы» – нейроны, которые работают так же как и рефлексы, с той лишь разницей, что активирующие сигналы поступают на эмоции;
  • – «Эмоции» – нейроны, которые активируются в случае активации замкнутых на них эмоциональных рефлексов. Совокупность активности нейронов-«эмоций» образует «эмоциональный фон», то есть то, как воспринимает и оценивает наше устройство отраженный через датчики окружающий мир. Изменение состояния датчиков может привести к изменению эмоционального фона. Каждый раз, когда происходит изменение эмоционального фона, то есть меняется состояние любого из нейронов-«эмоций», будем фиксировать на одном из нейронов памяти текущую картину активности. Отвечает за этот процесс «регулятор». Он выбирает свободный нейрон и дает ему команду на запоминание, а также сообщает, как изменилось эмоциональное состояние (+1 или -1).

    Изменение эмоционального состояния будем оценивать следующим образом:

    (+1) – если изменение привело к улучшению эмоционального фона, то есть возросла величина «хорошо» минус «плохо» (где «хорошо», «плохо» принимают значения 0 либо 1 и соответствуют неактивности либо активности нейрона «эмоции»). Например, (+1) возникает, когда появляется положительная эмоция («хорошо») или прекращается отрицательная эмоция («плохо»);
    (-1) – если изменение привело к ухудшению эмоционального фона, то есть уменьшилась величина «хорошо» минус «плохо» (где «хорошо», «плохо» принимают значения 0 либо 1 и соответствуют неактивности либо активности нейрона «эмоции»). Например, (-1) возникает, когда появляется отрицательная эмоция («плохо») или прекращается положительная эмоция («хорошо»).
    Если с изменением состояния обоих нейронов-«эмоций» итоговое эмоциональное состояние не изменилось, то на выбор читателя можно не запоминать такое событие или ввести принцип доминирования одной эмоции над другой.

    Вообще нет смысла ограничивать эмоции значениями -1,0,1. У человека эмоции проявляются с различной силой. Но сейчас ограничим себя, что бы показать качественную картину.
  • – «Память» – нейроны, которые могут находиться в трех режимах.

    Режим 1. Изначально все нейроны памяти девственно чисты и не оказывают влияния на работу системы.

    Режим 2. По команде «регулятора» нейроны памяти способны фиксировать картину активности других нейронов, связанных с ними (датчиков, эмоций, исполнительных нейронов). Фиксируется состояние активности на связях и направление изменения эмоционального состояния системы – (+1) или (-1).

    Режим 3. Запомнив свою картину, нейрон памяти переходит в новое состояние. В этом состоянии нейрон активируется, если «узнаёт» картину активности, которая соответствовала моменту запоминания. Активировавшись в случае определенного рода «повторения» картины активности нейронов, соответствующей моменту запоминания, нейрон памяти подает сигналы по всем направлениям, которые были активны в момент запоминания. Причем если в момент запоминания изменение эмоционального состояния имело значение (+1), то сигнал подается активирующий (+1), если же значение было (-1), то тормозящий (-1);
  • – «Регулятор» – это, скорее, не отдельный нейрон, а некий узел, который можно собрать из более простых «классических» нейронов, но сейчас не хотелось бы отвлекаться на описание его возможного устройства. Регулятор дает команды нейронам памяти на запоминание и сообщает им направление изменения эмоционального состояния.


Такое устройство, которое, кстати, несложно реализовать на практике, ведет себя как живой организм. Сначала его поведение полностью определяется рефлексами и представляет собой реакцию на состояние датчиков. Но, кроме рефлексов, устройство имеет возможность формировать инстинкты, то есть способность испытывать эмоции и запоминать события, приводящие к их изменениям. Со временем память накапливает информацию о том, какое поведение оптимально в той или иной ситуации с точки зрения максимизации положительных эмоций. Память начинает оказывать влияние на исполнительные устройства. Чисто рефлекторное поведение сдвигается в сторону инстинктивного.

Рассмотрим, как это происходит. Пока память чиста, состояние исполнительных нейронов определяется нейронами рефлексов. Сталкиваясь с ситуациями, «прошитыми» в рефлексах, наше устройство будет выполнять действие, предусмотренное ими. Какие рефлексы целесообразны – это определяется естественным отбором. Применительно к живым существам можно сказать, что возникнут и зафиксируются рефлексы, которые обеспечат поведение, способствующее:
  • – выживанию и размножению;
  • – скорейшему обучению инстинктивному поведению.

При совершении различных действий, на которые толкнули рефлексы, будет меняться состояние нейронов-«эмоций». То, какие будут возникать эмоции, зависит от нейронов «эмоциональных рефлексов». Они распознают картину на «датчиках» и «трактуют» ее как «хорошо» или «плохо». Сам факт оценки ситуации в терминах эмоций не влечет никаких немедленных действий, память просто фиксирует все ситуации, в которых менялся эмоциональный фон. Другими словами, каждый нейрон памяти фиксирует воспоминание об определенной ситуации (что это за ситуация, определяется уже состоянием нейронов-«датчиков») и запоминает информацию о том, привело ли совершенное в этой ситуации действие к улучшению или ухудшению эмоционального состояния.

Далее нейроны памяти, «узнавая» ситуации, которые соответствуют их «опыту», начинают вносить свой вклад в формирование поступков. За счет процессов активации они стимулируют к действиям, которые дали улучшение состояния, а за счет процессов торможения предостерегают от поступков, которые привели к его ухудшению. В условиях, когда датчиков, отображающих внешний мир, не так много, в памяти могут фиксироваться противоречивые воспоминания. При одной и той же картине на датчиках одни и те же действия могут вести к разным результатам. Это означает, что либо из-за недостаточности информации были отождествлены две разные внешние ситуации, либо само явление носит случайный характер. В таких ситуациях накопление опыта приведет к тому, что исполнительные нейроны, суммируя сигналы возбуждения и торможения, будут выбирать то действие, при котором выше вероятность положительных изменений эмоционального состояния.

Если мы захотим усовершенствовать наше устройство, то, оглядываясь на мозг человека, можем понять, что у нас в запасе – множество «эволюционных приемов». Например:
  • – Можно заняться топологией устройства. К примеру, расположить датчики на плоскости (сенсорный слой) и сгруппировать их по признаку переносимой ими информации (звуковой, зрительной и т. п. Далее разместить нейроны памяти «слоем коры» над ними и охватить связями преимущественно те зоны, над которыми они находятся, придав тем самым памяти деление на предметные области);
  • – Нейронам памяти можно дать возможность иметь связи между собой, позволив им включать память в картину текущего представления и тем самым, изменив распознавание, сделать его более устойчивым к стереотипным ситуациям;
  • – Можно надстроить более высокие слои памяти, которые позволят распознавать и запоминать более сложные, «абстрактные» конструкции;
  • – Можно ввести механизм импринтинга – когда по какому-то набору признаков будет распознаваться некий объект, ситуация, состояние, и будет осуществляться их привязка к определенным наборам эмоций и рефлексов (При этом инстинкт будут направлен не на те признаки, которые вызвали срабатывание импринтинга, а на зафиксированное памятью явление, распознаваемое по дополнительным признакам, которые изначально отсутствовали);
  • – Можно использовать для передачи информации между нейронами не только существующие связи, но и ввести некие управляющие сигналы, доступные сразу всем нейронам «мозга» автомата, и с их помощь реализовать, например, работу «регулятора»;
  • – Можно увеличить количество эмоций, сделать их картину значительно более сложной;
  • – Можно ввести параметр «сила эмоции» и учитывать его при «запоминании» и «управлении»;

В общем, нет предела совершенству…

Описанное устройство может приспосабливаться к среде, эволюционировать, но не мыслить. Для мышления ему необходимы существенные изменения конструкции и введение новых принципов. Я попробую описать их в последующих постах.
Tags: ИИ искусственный интеллект мозг нейронные сети
Hubs: Artificial Intelligence
+23
2k 45
Comments 41
Ads