AlexeyR Oct 15 2016 at 16:38

Логика сознания. Часть 8. Пространственные карты коры мозга

27 min

23K

Programming*Algorithms*Concurrent computing*Machine learning*

+35

Comments 21

ganqqwerty Oct 15 2016 at 17:25

Очень интересно читать, спасибо. Обещаю разродиться описанием того, что делается в более приземленных и не относящихся к сознанию областях, которые изучаются в Blue Brain Project (с точки зрения программистов и специалистов по базам данных).

Halt Oct 16 2016 at 14:15

Спасибо за очередную статью!

Задача стоит не в том, чтобы сформировать пространство детекторов с плавным переходом вектора признакового описания, а в том, чтобы расставить на плоскости дискретно заданные элементы в соответствии с определенной мерой их близости. Как мы показали ранее, такую расстановку можно получить, используя алгоритм, основанный на попарных перестановках элементов.

Хо-хо, вот уж не думал, что мозг и сортировка пузырьком будут иметь что-то общее! Хотя, мне кажется, что в реальности имеет место процесс, напоминающий сортировку вставками, когда элементы постепенно «проваливаются» на подходящее место. Ну и конечно, в отличие от простейших компьютерных алгоритмов, процесс происходит параллельно для всех элементов.

В зависимости от того, стимуляция какого глаза вызывает наиболее сильный ответ, были составлены карты глазодоминантности.

На всякий случай, дам ссылку на видео, демонстрирующее аналогичные процессы в природе, в частности при образовании паттернов на шкуре животных, складок у морских губок и др. Основная идея в том, что для образования подобных структур требуются два фактора. Первый фактор — наличие взаимовлияющих, но противоборствующих агентов с ускоряющей и тормозящей активностью в некоей среде. Второй фактор — геометричность процессов. То есть, влияние агентов должно локализоваться и распространяться в пределах некоей области. В результате можно получить самые разнообразные паттерны. Насколько я понимаю, в вашем случае происходит ровно то же самое. Соответственно, можно применять разработанный мат аппарат для поиска дальнейшего соответствия.

В результате трансформации получается описание, соответствующее тому, как выглядел бы исходный образ после такого преобразования. Наиболее очевидные трансформации – это смещение по горизонтали и вертикали, а также вращение образа. Контексты в таком «очевидном» случае – это всевозможные комбинации смещений и поворотов.

Если декодирование образов происходит на более высоком уровне, нежели ансамбли линий и краев, то почему тогда скорость восприятия текста зависит от его расположения? Перевернем текст вверх ногами и отзеркалим его — скорость чтения упадет в разы (хотя будет все-еще возможной). Да, конечно, можно утверждать, что мы привыкли парсить текст в нормальной ориентации, но все-таки? Если существуют контексты для всех возможных ориентаций, почему не срабатывают те, что соответствуют, скажем, букве Ы, повернутой на 180°? Или они не существуют или находятся не на своих местах?

Ну и отстраненный вопрос. Вы утверждаете, что мышление является дискретным процессом, хоть и выполняемым параллельно на множестве исполнительных устройств. Значит ли это, что подключившись к «шине» мозга и считывая проходящие волны, можно будет обнаружить отдельные мыслеформы и объяснить, каким путем элементарных замен субъект от исходного утверждения А пришел к заключению Б? Разумеется тут не учтено, что помимо детектирования волн их еще надо будет декодировать.

AlexeyR Oct 16 2016 at 14:50

Я думаю, что чем более непривычен ракурс тем меньше контекстов его обслуживают. Возможно, узнавание требует определенных итераций. В плохом ракурсе за счет этого может возрастать требуемое время.
Мне кажется, что считать информацию общую для зоны коры — решаемая задача.

SpaceEngineer Oct 16 2016 at 16:33

Буквы это все-таки не совсем элементарный образ. Возможно, они распознаются где-то в более высоких отделах коры. Если она обучена распознавать буквы в нормальной ориентации, то этот процесс оптимизируется до одного такта. У овладевших скорочтением распознавание идет уже на уровне целых слов. Если текст вверх тормашками, я замечал за собой мысленное усилие по «переворачиванию» его. Но если потренироваться, можно читать перевернутый текст не хуже прямого. Вопрос к Алексею, что при этом происходит — заучивание нового контекста для перевернутой буквы, или нового правила преобразования существующего контекста?

Halt Oct 16 2016 at 18:57

Буквы это все-таки не совсем элементарный образ. Возможно, они распознаются где-то в более высоких отделах коры.

Я исходил из этой фразы статьи:

В нашем подходе миниколонки – это контекстные модули. Они не детектируют какой-то простой образ, а выполняют куда более сложные функции.

Иероглифы, кстати, парсятся тем же способом, причем вне зависимости от сложности знака. Самое интересное, что один раз бросив взгляд на знак, можешь уверенно сказать, знаешь ли ты его или еще никогда не видел. Но приходит такое умение со временем.

AlexeyR Oct 16 2016 at 21:27

Возможно, я плохо варазил мысль. Миниколонка способна определять коды разных образов. Она не является детектором какого-либо конкретного образа. Классический подход говорит: нейрон — детектор определенного образа. Нейроны миниколонки настроены на один стимул. Я, собственно, пытаюсь показать, что это не так и объяснить, что стоит за такой реакцией нейронов.

RockPresident Oct 18 2016 at 13:36

Классический подход говорит: нейрон — детектор определенного образа.
Просто к слову о "классическом подходе" — даже просто посмотрев на топовые реализации текущих CNN, тот же Inception или ResNet, можно с уверенностью сказать что ни у кого нету убеждения что один нейрон распознаёт один образ. Нейрон где-нибудь в серединном из многочисленных слоёв в таких сетях может распознавать или какой-нибудь паттерн, часть образа, или положение других образов относительно друг друга и т.д.

AlexeyR Oct 18 2016 at 15:41

Все равно, формальный нейрон имеет один характерный стимул, определяемый его весами. Не суть важно, что стоит за этим стимулом: целый образ, фрагмент, взаимное положение. Идеология сохраняется: один нейрон — один стимул.

0x9d8e Oct 16 2016 at 21:45

Для меня с детства небыло особой разницы читать прямой, перевёрнутый или отзекаленный текст (не знаю насчёт перевёрнутого и отзеркаленного одновременно). Впервые это заметил в школе, когда списывал с одноклассником чью-то домашнюю работу. Он тогда очень удивился как это я перевёрнутую тетрадь читаю, да ещё и переписываю (не перевёрнуто) одновременно.
Второе подобное «открытие» было на физике, когда началась оптика. Я тогда решил задачу у доски, не используя угольник, но прикладывание оного показало, что он мне и не нужен. Просто потому, что градус угла (не любой, но все кратные, типа 30, 60, 90, 45, 75, 120 и т.п.) вижу очень хорошо, а поворот в пространстве (как и зеркальное отражение) никак на это не влияет.
Не думаю, что у меня какие-то аномалии. Скорее всего это доступно всем и тут дело в каком-то навыке: либо у меня к повороту изображений ещё до распознавания, либо у других более силён навык определения этого самого поворота. Идея несколько странно звучит, но я так думаю потому, что отзеркаленный (на перевёрнутый это у меня не распространяется, поворот совершенно безразличен) текст могу прочесть и не заметить его зеркальность, но вот если уж заметил это до того, как распознать, тут уж нужно приложить некое усилие, чтобы «забыть» об этом знании. И мне кажется именно такое знание и мешает людям читать перевёрнутый или зеркальный текст.

MrShoor Oct 18 2016 at 00:43

oldcastor Oct 18 2016 at 15:38

Нужно время «на освоиться», а потом включается механизм предсказания, когда из контекста и нескольких букв в большинстве случаев складывается нужное слово без его полного прочтения. Только в случае неудачного предсказания требуется время на повторное «привыкание» к тексту.
Ну и да, скорость чтения, конечно, поменьше.

SpaceEngineer Oct 19 2016 at 13:34

Круто, спасибо за пример)) Действительно, скорость немного меньше, просто из-за того, что не все слова сходу распознаются, приходится возвращаться.

AlexeyR Oct 16 2016 at 17:02

Трудно сказать. Скорее все сразу.

Halt Oct 16 2016 at 19:03

Алексей, есть еще вопрос по поводу глазодоминантности. Ваша теория дает какое либо объяснение, зачем вообще оно нужно? Почему, условно, не правый глаз — левое полушарие и наоборот? Чем обусловлено такое стремление «перемешать, но не взбалтывать»?

В принципе я и сам могу придумать подходящее объяснение из соображений оптимизации, избыточности, уменьшения задержек и параллакса, но интересно есть ли у вас что-то конкретное.

AlexeyR Oct 16 2016 at 21:21

Сопоставление изображений левого и правого глаза позволяет по параллаксу судить о расстоянии до объекта. А это требует некой совместной обработки информации от обоих глаз. Далее я покажу интересный принцип, который позволяет очень просто получить код расстояния.

VDG Nov 2 2016 at 17:04

Опять остановилось на самом интересном месте. Когда ждать продолжение?

AlexeyR Nov 2 2016 at 17:11

Очень хочу 7 ноября выложить следующую часть. Она о том как происходит обучение с учителем и без учителя. Там очень важнный материал, который позволяет понять в чем основная проблема нейронных сетей и как ее исправить (как это делает мозг). Решил немного обновить демонстрационную программу и засосало в полное переписывание. Сейчас доотлаживаю и выложу и код и статью.

Whiteha Nov 22 2016 at 09:53

С учетом ваших дел и тишиной последние две недели — когда можно ожидать продолжение?

AlexeyR Nov 22 2016 at 17:14

Не получается сделать примеры так быстро, как хотелось бы. Чтобы заполнить паузу завтра запишу виде с рассказом о следующем шаге рассуждений. Это будут объяснения (по мне очень важные для понимания работы мозга) о том как мозг делает то же, что делают и нейронные сети, но делает это совсем по-другому.
Выложу видео, видимо, послезавтра. А еще через неделю доделаю статью об этом.

sub_null Nov 29 2016 at 23:44

Алексей, спасибо за ваш труд, очень интересно читать. Есть ли у вас планы по реализации не отдельных частей, а некой целостной системы, которая демонстрирует какую-либо из областей? Насколько мне известно, было реализовано распознавание номера. Интересно было бы реализовать некую примитивную систему принятия решений на базе вашей теории. И еще вопрос, как вы считаете, возможно ли высокоуровневые функции мозга(планирование действий например) реализовать условно малым набором миниколонок?

Nashev Nov 12 2018 at 22:50

Не вижу до сих пор ответа на вопрос (хотя, его почему-то никто прямо и не задаёт), как получается что волна идёт с узором исходной информации, когда каждая колонка, видя сложившуюся вокруг неё картину, генерирует спайк про свой вывод из неё, а не просто как-то тупо её зеркалит? Ведь цепочка меняющихся по ходу распространения волны выводов всё большего и большего порядка — это совсем не то же самое, что волна неизменной исходной информации!?

Кажется что-то про шаги было, про такты, но как-то совсем без подробностей…

Show the best of all time