SubjectPersonalData Jul 22 2022 at 19:57

Теория алгоритма лежащего в основе фантазирования реальностью в мозге

6 min

Algorithms*Machine learning*Artificial IntelligenceBrain

Оригинальный взгляд на алгоритм распознавания объектов головным мозгом, который еще может и фантазировать с увиденными объектами и моделировать их. Так же он объясняет механизм генерации сновидений и на его основе можно объяснить работу пальцев рук.

Мы видим картинку двухмерной, но при фантазировании, например людей, мы их представляем как трехмерную модель. В ней, как бы у людей есть скелет для моделирования движений рук и ног. Но, не смотря на то, что мы используем 3D моделирование, понять как будут пересекаться объекты сложной формы мы не можем (для этого нужна начертательная геометрия). Согласно, данной теории у нас в мозге нечто среднее между 3D и 2D моделированием с пониманием вида поверхности - это к тому же объясняет, почему мы понимаем принадлежность теней объектам. По сути мы имеем 2D виды со всех сторон, но кроме этого запоминаются срезы объема объекта. (см. рис. 1). Срез - это вид сбоку на проекцию, показывающий объем (поверхность) объекта. Срез, в отличие от проекции является не картинкой, а кривой.

Есть два источника информации о поверхности объекта - это срезы и текст о типе поверхности у разных зон проекции (выпуклое, вогнутое, шарообразное и т.д.), кстати именно пользуясь срезами мы узнаем силуэт или тень объекта, причем тень может быть сильно деформирована, но мы ее все равно узнаем. На проекциях и на срезах одинаковые точки связаны связями и это дает возможность натягивать модель в мозге на видимый объект соответственно деформируя в фантазии модель (по одному виду мы представляем все остальные виды с других сторон). Пример, "нечто" из фильма ужасов, по картинке из фильма мы понимаем деформацию срезов и представляем его геометрию, т.е. срезы меняются и делают морфинг, так как они связанны с картинкой и наоборот.(см. рис. 2) Тот же морфинг в анимации - мы понимаем связь точек и срезов, как они перетекают друг в друга.

На рис. 3 показано как хранится в памяти информация об объекте, мы помним виды и срезы с существенными различиями. Разумеется сам объект имеет название (лицо), но также имеют названия и его отдельные части (глаза, рот и т.д.) и распознавши его часть мы понимаем объект и представляем о нем даже ту информацию, которую не видим. А если мы его осмотрели со всех сторон, то в мозге есть конкретная, а не представленная модель объекта.

Этот алгоритм понимает тени от объектов, ведь они являются искаженными срезами. Через срезы мы также понимаем картинки в виде контура гор, мостов, рек, облаков. Например, облако состоит из типовых шарообразных фрагментов имеющих круглый срез, которые распознаются как часть облака. На первый взгляд (см. рис. 4) абсолютно непонятно, как мы распознаем картинку - гора и дерево понятны, но они вовсе необязательны для понимания. А остальное по отдельности дорога, вода, камни, трава слишком нетипично выглядят (не так как в реальности), но так выходит, что оно понятно все вместе.

Помимо одинарных объектов которые помнит мозг, есть еще именованные наборы объектов, в данном случае луг - он состоит из разных предметов (трава, дерево) и контактирует он в реальности с разными объектами (река, дорога). Т.е. у луга и у других подобных слов есть определение, а в мозге это структура как на рис. 4. Пользуясь определением объектов мы получаем подсказки для распознавания всей картинки. Эти определения используются не только в распознавании, но при мышлении, об этом в указанных в конце статьях.

Давно замечено, что дерево является фракталом - это формула основанная на срезах, есть законы - внизу оно толще, наверху тоньше и на рисунке заметен фрагмент текстуры в виде штриховки. Мы понимаем реальность на базе объекта со всех сторон и на базе того, как один объект может менять форму (например, человек в разных позах). На основе этого создана мозгом модель фрактала см. рис. 5. В итоге мы имеем формулу в виде перехода одних объектов в другие, замкнутую на себя и на масштаб.

Одновременно с распознаванием идет работа с топографической картой ведь первоначально мозг пользовался зрением для ориентации в пространстве и его задача была найти путь к цели.(см. рис. 6)

При просмотре картинки мы получаем в мозгу карту - вид сверху этой территории, там где есть объекты, присутствуют их размеры и расстояние до них. Мы можем моделировать перемещение по этой картинке (основываясь на карте) и фантазировать с ней. Когда эту картинку рисовал человек, он пользовался взаимосвязями и определениями объектов и возможно не замечая того представлял карту. Если на рисунке есть объекты, которые не могут быть изображены на карте, например горы, солнце, облака, то они появляются на краю карты как недосягаемые. После распознавания появляются глаголы (исходя из фона на котором объект и модели) - трава растет, вода течет, камень лежит на берегу, у моста мы понимаем его устройство и этот мост является комбинацией из разных известных нам мостов. (см. рис. 7)

Также понимается фон, что река под мостом и дерево закрыло реку - как бы на основе известных срезов этих объектов. Это понимается на базе моделей дерева и моста. На базе размеров некоторых ключевых объектов (моста и перил) понятен размер досок у моста. Размер камней в воде понятен на базе размеров моста. Пользуясь картой и распознанным рисунком мы можем представить любую сцену происходящую на ней, например идущего по дороге человека. А нейросети, которые сейчас популярны такую карту не делают и по сути не могут, а если нет карты, то и невозможно понять рисунок.

Видя с одной стороны любой объект мы понимаем его вид со всех сторон и его поверхность (например, лицо). Также по видам ортогональных проекций чертежа мы можем представить трехмерную деталь.(см рис 8)

Видя отдельно одежду можно представить, как она будет выглядеть на человека одетом в другую одежду - это делается через распознавание ключевых именованных точек объектов (рука, плечо, пуговица) и натягивание картинки на картинку с учетом срезов. Этот механизм весьма примерный, но прикинуть можно (мы места несоответствий в представлении не замечаем).

Алгоритм позволяет связать несколько моделей одного объекта, но в разных состояниях словами связанными со временем (т.е. появляется прошлое и будущее), через этот механизм можно, например понять мимику лица или движения человека. Так в этой модели появляются глаголы действий и эмоций. Этот процесс имеет обратный эффект, можно представить в фантазии вид и действия человека в будущем. Наборы этих взаимосвязей связывают что мы видим и видели с глаголами и существительными описывающими реальность.(через этот механизм можно по позе понять, что человек бежит и т.д.). Глаголы движений несут в себе информацию о скорости и ускорении (в прошлом и будущем), для нас это выглядит как плавность движений.

Есть ключевые модели понимания реальности, которым ребенок учится в детстве. Это игра с кубиком, смотря на него с разных сторон мозг понимает аффинное преобразование (как одна и та же картинка выглядит под разными углами зрения). И еще это бросание мячика, мозг понимает скорости и ускорения падающего тела и потом использует это при фантазировании.

Можно запомнить множество картинок глаза с разным положением зрачка, но можно создать формулу (закономерность), что зрачок находится в зоне возбуждения области глаза. При создании формулы используются глаголы, где глаз это выход на другую модель. (см рис. 9)

Допустим, мы представляем, что сядем на трубу. У трубы есть срез - это круг. У сидящего человека тоже есть срез позы. Производится соприкосновение этих срезов и моделируется, может ли человек сидеть на ней (если труба метр диаметром, то у человека одна поза, а если 20см то или 3см, там другие позы - они связаны с разным удобством), с учетом, что надо опираться подошвами на землю, здесь это также моделируется (исходя из набора известных поз) и делается вывод удобно это или неудобно (и удастся ли вообще). У среза есть связь со свойствами поверхности (шероховатость, загрязнение, температура), все это участвует в моделировании, мы знаем какие будут последствия, если сделаем это действие. Мы примерно знаем через какие позы и движения будем садится, а там по месту движения корректируются и, например мы на что то опираемся.

Все взаимодействия людей решаются и моделируются на базе срезов и поз.(см рис. 10) Мы представляем как кривые среза будут соприкасаться - понимаем свою позу и другого человека. Например, через этот механизм слесарь прикидывает, войдет ли стержень в отверстие.

Так же надо заметить, что каждый из наших пальцев имеет срез и когда мы берем что то, то мозг делает так, чтобы срезы наших пальцев контактировали со срезом этого объекта. (см. рис. 11) Хотя работа с некоторыми объектами, типа ручки построена на другом принципе, но этому нестандартному взаимодействию нас специально учат в детстве.

Например в изобретательстве - тут мы не все комбинации взаимодействия объектов можем представить, но фрагментами суть понимаем, а потом рисуем и все подгоняем.

Если при моделировании во внутреннем взоре мы картинку не видим, то во снах этот механизм фантазии реализуется в полном объеме. Одушевленные объекты моделируются аналогами нашей личности (субъектами, об этом в абзаце ниже), места где происходят события это карты топографической памяти (об этом в абзаце ниже).

Мною в статье теория эволюции и работы мозга описано устройство личности и имитация поведения субъектов в мозге, эволюция алгоритма разума в нем и алгоритм работы зрительного анализатора. А в статье искусственный интеллект более подробно описаны принципы определений частей речи. В статье теория алгоритма, дающего смысл словам описано моделирование событий в мозге через слова. И я хотел бы отметить, что все что написано в этих статьях дополняет друг друга и эту статью и является описанием сильного искусственного интеллекта.

Инженер Головин Александр Владимирович

E-mail: axelfl35@gmail.com

Tags:

Hubs: