Pull to refresh

Comments 66

Ай, красиво, мне понравилось! Потому, что я точно так же люблю «оцифровывать» реальную жизнь в своих программах, строить модели. Только очень редко живые люди хотят пользоваться программами, «симулирующими» их реальную жизнь.
К примеру, мне очень нравилось формализовывать процесс рыбалки в программе-игре, там тоже куча различных объектов, свойств, действий, условий, результатов… и алгоритмы и базы данных должны быть очень большими и непростыми, чтобы всё это было похоже на реальность, но… это скучно, однообразно в виде программы. А обычная реальная рыбалка — гораздо интереснее для живого человека.
Спасибо за похвалу.
Самое забавное, что я тоже к рыбалке неравнодушно дышу. Очень неравнодушно.
Вот чего уж гарантированно нельзя формализовать — это поведение рыбы :)
Столетиями подтверждается, что поведение рыб — это симбиоз нескольких наук и… рандомов почти во всех параметрах «модели», неподвластных человеческому мозгу.
Формализовать поведение нельзя, но имеются подходы и к рыбам. К сожалению, это не тема для обсуждения на айтишном ресурсе.
UFO just landed and posted this here
Вывод: дизайнеры — это не простые люди. Общение между ними невозможно.
Напротив, вИдение дизайнеров вполне соответствует вашим критериям. А вот как формализовать «купи пачку розового», если на самом деле оно сиреневое и в бутылке?
Во-первых, пост посвящен формальным определениям тезауруса, а не формализации высказываний. Если известны формальные определения терминов «купить», «пачка» и «розовый», то цель достигнута. Цели формализовать фразу «купи пачку розового» я не ставил (хотя это вполне возможно).
Сам ваш пример крайне неудачен, по-моему. Если кто-то дальтоник, то искомая фраза окажется непонятой без всякой формализации, во вполне себе разговорной речи. И с этим ничего не поделаешь.
Я тоже не про дальтоников, а про тезаурус, точнее про сложности дискретизации аналогового. Слов мало, оттенков цвета и вариантов формы гораздо больше. Где заканчивается синий и начинается голубой? Когда шар становится геоидом? Как-то так.
Навеяло вот этой темой.
Понятно.
Да, есть такая проблема. В посте я ее мельком коснулся, кстати:
Язык как средство формализации тоже ведь дает приблизительные результаты: как, к примеру, вербально описать пятно сложной геометрической формы? Никак: точно не опишешь.

Эта проблема не решается в естественном языке, соответственно не может быть решена в формализованном варианте. Результат всегда будет приблизителен. Это надо понимать.
Так на своём слое он красный opacity 60%, а после наложения на белый фон получается розовым.
Это он в фотошопе по слоям. А, к примеру, у Есенина розовый конь — результат рассветного освещения и художественного воображения =)
Я как-то страдал этим вопросом. Проблема состоит в том, что отношения между объектами — ровно такие же термы (слова) как и то, что они описывают. Попытка вытащить определения в категории «принадлежит» не вытаскаивает его из лингвистической паутины.

Каждое слово определяется бесконечным набором отношений с другими словами (графом), а получившаяся фраза — результат применения функции (нелинейной) к этим графам. Попытка распутать граф на базовые примитивы приводит только к тому, что у нас появляется ещё больше бесконечных графов, обработанных ещё большим числом нелинейных функций.
Вы изложили проблему, но почему-то не заметили предложенного мной решения. Количество графов увеличивается, конечно, но при этом количество слов не увеличивается, даже если обозначить отношение каким-то термином. Термин, обозначающий отношение, будет единственным.
По сути, предлагается то, что реализовано в математике. Берется аксиома (неопределяемые понятия), из них выводятся теоремы, из них — последующие теоремы, и т.д.
Неопределяемые понятия не составляют графы. Какой может быть граф в слове «синий»? Это непосредственно результат ощущения. Любое определение данного термина будет некорректно, т.к. сможет базироваться на последующих, более сложных понятиях.
Соответственно, вся сложность в том, чтобы последовательно вывести из неопределяемых терминов все остальные.
Количество слов не увеличивается, но изменяется коннектом. Забуем на секунду бесконечность и представим, что у нас есть язык из трёх термов: A, B, C (для удобства '=' двусторонняя связь, '-' односторонняя).

Они связаны таким образом (для B) A=B-C, (для A) B=A=C. Что будет в результате A?B? А чёрт его знает.

Заметим, коннектом (граф) оказывается параметризирован словом. Например, если мы говорим про «процесс», то слово «удалённый» будет ограничено в связях с соседями семантикой слова «удалённый процесс» (т.е. процесс, который далеко). А если будет «удалённый» в контексте «файл», то семантика будет ограничивать смыслом «стёртый».

Насчёт «синий». Нет синего. Есть то, на что показали окружающие и сказали «это синий». Я не буду постить это злосчастное платье, но «синего как ощущения» не существует. При этом можно притащить коннектом и сказать, что синий — это электромагнитная синусоида на 450 нм, но тут мы завязнем в «синусоиде», безумном научном жаргоне о том, что синусоида бывает только бесконечной, погрешности измерения и т.д.

А можно притащить контекст и сказать «вон, небо синее», на что будет понятно, что оно голубое.

Невозможно свести язык к «я мыслю, значит я существую». Язык требует слушателя, а значит, требует чужого сознания и чужого восприятия. В этом месте исчезает «реальность, данная нам в ощущениях» и появляется работа с проекциями, схождением к «компромиссу» и динамикой во времени и популяции, после чего модель становится бесконечно запутанной и неподъёмной.

А при исключении этих элементов исчезает коммуникативная функция языка.
Вы весьма мудро и смачно излагаете, но согласиться не могу.
1. Про двустороннюю-одлностороннюю связь, честно говоря, не понял. Я представляю, что это такое, но не вижу примеров односторонних связей в языке. По-моему, там все связи двусторонние.
Я исхожу из структуры фраз: субъект — действие — объект. Для меня это сама очевидность.
2. Про «удаленный». Да, проблема известна. Существуют многозначные слова. Некоторые слова могут использоваться в переносном значении. А еще существуют фразеологические обороты. Однако данных вопросов я не касался. Ясен пень, что практическое решение потребует преодоления куда бОльших сложностей, чем описано в коротеньком посте.
3. «Синее» как ощущение безусловно есть. Давать «синему» определения через электромагнитную синосоиду некорректно.
Извините, но вы приписываете мне иные цели. Я не рассматриваю вопрос межсубъектной синхронизации смыслов, а решаю лингвистические задачи. У меня «синий» — синий для всех, по умолчанию.
4. С чем согласен, так это с тем, что проблема бесконечно запутанная и неподъемная. Но это не значит, что ее нельзя пытаться решить.
UFO just landed and posted this here
Основная проблема в интерпретации естественного языка — это его неоднозначность.

Абсолютно согласен. Однако я решал другую проблему: наметить пути к созданию Словаря лексических связей — такого, в котором бы существовало конечное число начальных неопределяемых терминов, а все последующие термины выводились бы из предыдущих. Если вы этого не смогли понять, статья прошла мимо вас, конечно.
UFO just landed and posted this here
Вы таким образом пытаетесь избавиться от рекурсивного определения?

Да.
такие определения — это признак логической ошибки в определениях.

Именно поэтому я и пытаюсь избавиться от рекурсии.
это не защитит вас от циклических определений вида :«бегемот(s) = гиппопотам(s), гиппопотам(s) = бегемот(s)» и от менее банальных вещей.

Защитит. Если «бегемот» уже определен, а «гиппопотам» нет, то определение «гиппопотама» следует давать через «бегемота», но не наоборот.
Почему вы считате «цикл» проблемой? При обработке (при извлечении данных) учитывайте возможную бесконечную рекурсию и не входите в нее.

Данные можно извлекать, не входя в рекурсию, а толку, если у полученных терминов не будет определения?

ИМХО прежде всего нужно определить цель формализации. Нпр., для школьных целей формализация русского (английского и др.) очень даже существует и изложена в учебниках по языку. Если нужна более детальная формализация, нпр., для ИИ, то м.б. не начинать ее с нуля, а взять за основу уже проделанную в учебнике? Или объяснить, почему такой путь не подходит. Автор использует термины «существительное», «глагол», «наречие», которые используют школьные учебники языка, но почему-то не использует такие термины, как «подлежащее», «сказуемое», «дополнение»…
Ну мог бы я использовать термины «подлежащее», «сказуемое», «дополнение». Субъект — подлежащее. Действие — сказуемое. Объект — дополнение. Что бы это дало дополнительно к имеющемуся? Всегда приходится выбирать между синонимичными терминами, останавливаясь на чем-то одном.
Что бы это дало дополнительно к имеющемуся?
Возможность использовать в целях расширения существующую и оправдавшую себя формализацию, а не изобретать лишние сущности (см. Бритва Оккама). Учебники содержат не только термины, но и правила построения фраз (предложений). Применение этих правил необходимо для понимания ИИ естественного языка.
Не настолько использованная мной терминология и оригинальна, чтобы пенять на ее употребление. Тем более что никаких новых сущностей я не изобретал, так что говорить о бритве Оккама не приходится. Просто для изложения моей концепции больше подходят термины «субъект», «действие» и «объект», чем «подлежащее», «сказуемое» и «дополнение». Они мне кажутся более точными.
Неужели в процессе чтения что-то оказалось непонятным?
Когда один термин заменяют другим, то возникает возможность ошибок подмены термина. Уже на чисто формальном уровне становится непонятным, как использовать правила построения фраз из существующих учебников. А недоброжелателям (я не из их числа — я искренне пытаюсь разобраться в Вашем тексте) Вы даете возможность на Ваше утверждение:
Не настолько использованная мной терминология и оригинальна, чтобы пенять на ее употребление. Тем более что никаких новых сущностей я не изобретал

обвинить Вас в том, что ничего нового Вы не сказали, а просто заменили стандартные термины, чтобы выглядело, как новое.
Дело не в отношении к тексту или автору, а в сути претензий.
Меня всегда интересовала философия. Язык для меня — продолжение философии. Соответственно, я употребил привычную для меня стандартную(!) терминологию. Термины «подлежащее», «сказуемое» и «дополнение» в философии, извините, не котируются.
Сказал я что-то новое или не сказал, это вопрос не ко мне. Пытался сказать, а насколько получилось, пусть решают другие.
Меня всегда интересовала философия. Язык для меня — продолжение философии.

С точки зрения философии следует уважать традицию ссылки на предшественников. Возьмем один из самых известных для многих читателей источников (его не так давно во всех вузах сдавали):
Что значит дать «определение»? Это значит прежде всего подвести данное понятие под другое, более широкое. Например, когда я определяю: осел есть животное, я подвожу понятие «осел» под более широкое понятие. Спрашивается теперь, есть ли более широкие понятия, с которыми могла бы оперировать теория познания, чем понятия: бытие и мышление, материя и ощущение, физическое и психическое? Нет. Это — предельно-широкие, самые широкие понятия, дальше которых по сути дела (если не иметь в виду всегда возможных изменений номенклатуры) не пошла сих пор гносеология. Только шарлатанство или крайнее скудоумие может требовать такого «определения» этих двух «рядов» предельно-широких понятий, которое бы не состояло в «простом повторении»: то или другое берется за первичное. (В. И. Ленин, Материализм и эмпириокритицизм, гл.3)

Что принципиально нового добавили Вы?
1) Выделил неопределяемые понятия.
2) Показал, каким образом из неопределяемых понятий можно получить последующие.
3) Указал способ образования однокоренных групп: из одного начального термина.
4) Установил типы слов (по критерию происхождения).

Это с моей точки зрения. Но я могу заблуждаться.
Выделил неопределяемые понятия.

Нпр., если я правильно понял:
Термин, не требующий дефиниции: белый он и есть белый.

Но, нпр., в модели RGB белый определяется через R,G и B. Ваше выделение сомнительно.
Да, поняли правильно.
А что сомнительно: это бывает. Любая концепция имеет тысячу альтернативных. Вопрос: какой концепции верить?
Вопрос: какой концепции верить?
ИМХО зарекомендовавшей себя на практике. А если существуют недостатки и нужно их преодолеть, то научная традиция предписывает:
1) Описание недостатков прежних наиболее распространенных концепций.
2) Сравнение предлагаемой концепции с существующими для демонстрации преодоления указанных недостатков.
3) Показать, что преодалев одни недостатки не внесли новых, которых не было в прежних концепциях.
Во-первых, RGB нимало не противоречит моей концепции. Если вы считаете, что существует всего три цвета, можете использовать три значения атрибута «цвет», на здоровье. Иначе говоря, данные концепции вообще никак не соотносятся между собой, они о разном.
Во-вторых, у вас вопросы только по одному пункту из четырех? Остальные три пункта принимаются?
они о разном
О каком разном? RGB формализует цвет и Ваша формализует цвет. Но Вы утверждаете, что белый не требует дефиниции. Наверное, это будете утверждать и про любой другой цвет? Получается миллионы только цветов без дефиниции.
Вы пытаетесь обсуждать действительно проблемную вещь, но при этом второстепенную.
Алгоритм такой:
1. Определяем атрибут. В данном случае «цвет».
2. Определяем область значений данного атрибута (конечный перечень возможных значений). Любой выбор может быть оспорен, потому что аналоговое не сводится один-в-один к дискретному. Если, к примеру, мы взяли цвета «красный», «синий», «зеленый», «черный» и «белый», то «оранжевый» потребует формульного определения: допустим, как «красный» и одновременно «белый». Мысль ясна?
Я упомянул «белый» исключительно в качестве примера. Вопрос корректного задания атрибутам областей определения в посте вообще не рассматривался.
Цвет — это переизлученное излучение, причем определенного типа т.е. электромагнитное, причем такое что видимо в условном видимом диапазоне. Причем далеко не всеми. Причем с учетом коррекций цветовой модели. Причем с учетом дефектов восприятия человеков. Причем с учетом региональных языковых особенностей, ибо не везде есть голубой и синий и прочее-прочее… У некоторых народов вообще четыре цвета и им хватает. А у некоторых художников 350 именованных цветов и им не хватает. Причем когда вы на два оттенка красного тычете пальцем и говорите что они оба красные — как такое может быть вообще?)

Вы точно понимаете, куда вы лезете? Вы масштаб проблемы действительно улавливаете?

Впрочем, когда я прочитал, что голова круглая и твердая, то в общем-то все стало понятно)))

пс: Чёрного цвета не существует, ибо это логический бред. А теперь поймите откуда оно пошло и как это исправить.

ппс: Даже шнобилевкой не пахнет. Уровень пту, не более… Извините, если слишком резко.
Ага, цвет — это переизлученное излучение, чего ж непонятного?! А мой ноут черного цвета — логический бред. Как я сразу не догадался!
Вспомним, для чего нам вообще необходим язык. Для корректного отражения окружающей нас действительности в процессе коммуникации.
Функций языка больше раз в 10. Вы нащупали только одну.
Описанный вами подход тоже тупиковый. Т.к. само количество типов слов в реальности произвольно и задается в процессе обучения. А у вас оно фиксировано. Одни и те же слова могут быть разных типов. Каждый переход по предлагаемым вами отношениям слов искажает смысл начальной словесной конструкции (и теряется знание), а надо наоборот, чтобы смысл уточнялся и прояснялся.
Функций языка больше раз в 10. Вы нащупали только одну.

Я не нащупывал, я просто указал, полагая, что для преамбулы достаточно.
Описанный вами подход тоже тупиковый. Т.к. само количество типов слов в реальности произвольно и задается в процессе обучения. А у вас оно фиксировано
.
Хм… Я как раз доказываю, что количество типов фиксировано. Если вы считаете иначе, нужны пояснения.
Одни и те же слова могут быть разных типов.

Если вы имеете в виду многозначные слова, то да, данный аспект мной не рассмотрен. Но это же совсем несложно, в рамках заявленной логики. Ну, считайте каждое из значений отдельным словом, или одно слово группируйте по значениям, как это делается в словарных статьях. В чем проблема?
Выскажу некоторые мои соображения, которые могут оказаться полезными для автора.

Если ваша цель — интеллектуальный поиск в некой БД или БЗ, то вам нужно перевести предложение (запрос) в формулу логики 1 порядка, если это вообще возможно. Так как и первое, и второе связано с отношениями, что суть, предикаты. Можно как промежуточный язык использовать Логлан, Ложбан, по идее.

Вообще, естественные языки нужны для взаимодействия агентов. У каждого агента — свои представления о реальности, и ТОЛЬКО представления. Представления не содержат объектов реальности, максимум — их образы, искажённые призмой восприятия агента, и отношения между этими образами. Также представления агента содержат образы объектов, не существующих в мире объектов реальности — например абстрактные понятия (число, функция), понятия о взаимодействии агентов (преступление, долг, честь), о состоянии агентов (эмоции, совесть), понятия об изменении реальности (плывёт, летает) и прочее.

Язык может передавать только мелкие клочки этих представлений, и делает это более-менее эффективно за счёт передачи существенного (для текущего акта коммуникации) содержания. Но нельзя передать представления целиком — у принимающей стороны образы всегда формируются свои, даже если в процессе общения разницу найти нельзя — это изменение связей совершенно других нейронов.
Формализовать крупные классы — легко. И компьютер с их обработкой справляется на ура.
Попробуйте формализуйте все слова здесь, особенно по вашим «аксиомам»:
«я ещё не закончил», «оно мне сильно уж нравится», «ты такой необычный», «она её сделала довольно слабой», «тролль положил в карман куртки» и объясните, почему можно говорить «не началось уже», но не очень хорошо звучат фразы «ли можно уже», «Иван войдя в комнату, он сел» и «Я оставил день­ги для соседей друг у друга».
И кстати, что такое «Российский сыр»? «Российский» — это отсылка к стране производителя, к месту производства, к марке, выражение отношения «свой-чужой», выражение отношения к (не)качественному товару, ничего не значащий набор букв, или, может, принятое между террористами обозначение для чего-то другого? (Кстати, может ли «Российский сыр» быть произведён в Крыму? ) Выходит, у фразы быть несколько значений одновременно, и не всегда можно своему знанию доверять, и что некоторые понятия вообще никак не сводятся к базовым (так какое, говорите, базовое понятие для «российского сыра»?). И как вы с такими фразами собираетесь тогда работать своей методикой?

Хватит уже изобретать велосипед, прочитайте хоть одну профильную книгу.
Например, «Тестелец Я.Г. Введение в общий синтаксис».

Жду, когда вы осознаете, что описания эффекта одиночных слов мало, и вам нужно описать не менее 10 миллионов языковых единиц: различных слов, фраз и выражений, которые меняют смысл и употребимость в разных условиях. После чего, полученный набор вероятностных правил невозможно эффективно запрограммировать.
А потом придут нейросети, которые хоть как-то позволят решать сложные практические задачи. Правда, для них нет больших датасетов для большинства задач… Но уж формально-лингвистическом подходом эти задачи тем более не решить.
1. Целью настоящего поста являлась формализация не фраз, а тезауруса. Если вас интересуют фразы, смотрите другой мой пост:
habr.com/ru/post/420197
2. За ссылку спасибо, гляну при случае.
3. Нейросети давно пришли, а ИИ не видать. Не потому ли, что недооценивается формально-лингвистический подход?
4. Я занимаюсь тем, чем мне нравится заниматься. Если вас что-то не устраивает, просто не читайте.
>1. Целью настоящего поста являлась формализация не фраз, а тезауруса. Если вас интересуют фразы, смотрите другой мой пост:
habr.com/ru/post/420197
Я читал, и даже комментировал. Не формализуете ли слова из моих предложений? Например, что значит «уже», «слабый» или «довольно»? Может, тогда возьмёте слово «её»? (Так, думаем. «её» — это вроде существо или объект женского пола… А что такое женский пол… И почему «сковородка» — женского пола, а «карандаш» — мужского? И как мы это наблюдаем своими органами чувств?)
Тезаурус — это про смысл слов. Но слова имеют смысл в контексте. Но в вашем тезаурусе нет контекста!.. Шах и мат. Надеюсь, последний пример был наиболее наглядным.
>2. За ссылку спасибо, гляну при случае.
В прошлый раз вы ссылки, как я понимаю, не посмотрели. Зачем учиться на опыте других людей? Ведь можно повторить их ошибки самостоятельно!
>3. Нейросети давно пришли, а ИИ не видать. Не потому ли, что недооценивается формально-лингвистический подход?
Нет, вовсе не поэтому. Комбинация этих подходов имеет некоторый смысл, но сделать её пока не получается.
Сам этот подход никто не недооценивает, просто любой приличный учёный учится на работах своих предшественниках: работах Витгенштейна (читая и раннюю, и позднюю его ключевые работы), и трудах Мински с его фреймами (это когда в 60е годы на ЛИСПе повторяли примерно то, чем занимаетесь вы со своим ботом). И даже английский WordNet в 80х-90х-00х сделали — довольно мощный тезаурус, кстати, до сих пор с ним сравнивают решения различных задач. И Тузов свою Семантику русского языка написал в 2003м и часть кода своего словаря в статьях и в диссертации описал.
Зачем они это делали? Чтобы mikejum это потом описывал так, как будто сам всё изобрёл?
>4. Я занимаюсь тем, чем мне нравится заниматься. Если вас что-то не устраивает, просто не читайте.
Считаете ли вы, что недоговорённость во фразе может быть элементом обмана, введения других людей в заблуждение?
Вы не ссылаетесь ни на кого, как будто находитесь в вакууме. Читающие вас могут пойти за вами и больно расшибить коленки. Их я и предостерегаю своим публичным комментарием, и рассказываю, куда нужно вместо этого идти, и почему. А вас убеждать не мыслить в духе анекдота, где «чукча не читатель, чукча писатель» — безусловно, не имеет никакого смысла. Пишите, но с дисклеймером: «Дисклеймер: я специально всё делаю не лучшим образом, ведь моя цель — заинтересовывать людей заниматься хайповыми чат-ботами, а не научить их использовать наилучшие технологии для решения задач». В общем, ваши бы писательские навыки направить на более современные технологии…
1. Да, читали, помню.
2. «Ее» — это ссылка, вне конкретного контекста не имеющая смысла. «Сковородка» — женского пола, но могла бы быть мужского, ничего бы не изменилось. «Сковород». И что этим доказано? С другими словами несколько сложнее, но никакого шаха и мата не наблюдаю.
3. Мне постоянно рекомендуют что-то прочитать, на большинство книг не хватает времени. К тому же чтение — занятие сугубо индивидуальное. Но вообще, я довольно прилично начитан, хотя список прочитанного не совпадает с вашим, конечно.
4. Вы мне инкриминируете изобретение велосипеда. Есть мальца. Однако в любом случае я не краду, не занимаюсь цитированием общеизвестного в научных журналах, а прихожу к каким-либо выводам своим умом, затем публикую. Вы мне это запретите? Четверостишие такое знаете:

Так не одно сокровище, быть может,
Минуя внуков, к правнукам уйдет.
И новый бард чужую песню сложит
И, как свою, ее произнесет.

5. За мной идти не надо, потому что действительно можно расшибить колени, вы правы. Это мой и только мой путь.
6. Вам известно, какие технологии современные, а какие нет? А перспективные технологии вы так же легко отличаете от неперспективных? Мне бы ваши таланты.
>6. Вам известно, какие технологии современные, а какие нет? А перспективные технологии вы так же легко отличаете от неперспективных? Мне бы ваши таланты.
Ну, если повторять то же самое, что сделали люди до вас, то не считаете ли вы, что результат изменится?
По терминологии: Современные технологии — это новые. А перспективные — это те, которые имеют возможность превзойти определённый качественный или количественный барьер, отделяющий их от альтернатив. Часто этот барьер становится виден сразу при описании технологии, при сравнении технологии с конкурентами.
Вот такой барьер в ваших технологиях — ручное набивание базы данных и экспоненциальный взрыв сложности анализа и вычисления ответа при разрастании базы. Альтернативы, которые могут преодолеть эти барьеры — лучше вашей технологии.
Вот, например, полгода назад опубликовали ЭТАП-3. Это языковой парсер на правилах — 30 лет его базы (морфологию, тезаурус, правила взаимодействия слов) набивали руками. Он сейчас работает, кажется, со скоростью порядка 1 предложения в секунду, в нём отсутствует куча редких слов и понятий. Вот он предел вашей технологии.
Захотите совместить это с автоматической добивкой базы данных? С быстрым приближённым выводом ответа? И получатся ровно те же современные нейросети.
Насколько я понял, автор не знаком даже с Категориями Аристотеля. Долго придется догонять… )))
Тоже появлялись похожие идеи. И нашел, что
  • В толковом словаре Longman меньше 2000 слов. Сказано, что через них определяются все остальные слова (дефиниции слов толкового словаря). Причем число понятий можно еще сократить!
  • В работе про «Универсальный семантический код» (автора сейчас не припомню) был перечислен исчерпывающий список из менее 2000 отношений понятий.
  • В толковом словаре Ожегова слов меньше 50000.
  • Активный словарный запас бывает 4000-10000 слов.
  • Использование некоторых терминов может более четко определять контекст — вариантов значений слов будет меньше.

Так что сделать что-то более-менее работающее, похоже, можно. А если учитывать вероятности и использовать нейронные сети для уменьшения неопределенности поиска — можно еще улучшить «понимание» == уменьшить количество подходящих по контексту наборов дефиниций слов(понятий).

Система, построенная на такой «базе понятий» должна получиться более предсказуема, чем нейронные сети. Ну и в любой момент можно будет «объяснить», почему приняты те или иные решения по использованию понятий(дефиниций слов). Извлечь же подобную информацию из нейронных сетей пока затруднительно.

Субъективно, детерминированный подход мне нравится больше, чем чисто вероятностный, основанный на нейронных сетях. Думаю, что нейронные сети должны быть вспомогательным инструментом для сужения пространства решений.
> Термин, не требующий дефиниции: белый он и есть белый.

Вы никогда не пытались подкрасить белой краской белую поверхность?

> Когда я вижу зайца, это очень конкретный заяц – вот именно этот, – а не вообще какой-то из зайцев

Когда вы видите зайца, в ваш глаз поступает большое количество электромагнитных волн из разных точек пространства, которые при постобработке, основанной на предыдущем опыте и обучении, превращаются в объекты. Никакого «зайца» не существует, как и ложки — это только ваш опыт. Как там у Юдковского было?
Нет никаких частиц, есть лишь облака амплитуд в пространстве состояний множества частиц. И то, что его мозг наивно считает ластиком, не более чем гигантский множитель волновой функции, который тоже можно разложить на множители. Сказать, что он самостоятельно существует, всё равно, что сказать — внутри числа «шесть» существует независимый множитель «три».
Вы никогда не пытались подкрасить белой краской белую поверхность?

На оттенки намекаете, что ли? Данный вопрос уже обсуждался, в других ветках.
Никакого «зайца» не существует, как и ложки — это только ваш опыт.

И я тоже так считаю. Однако, если эти «облака амплитуд» складываются в одинакового зайца для общающихся между собой субъектов, вопрос исчерпан. Далее можно рассматривать зайца как материальный объект, что я и делаю. Меня именно этот вопрос занимает, а не тот, который вы ставите. Пост совсем о другом.
С философской стороны вы, кажется, уже вот-вот доберётесь до формализации генеративной или эмерджентной грамматики (у вас пока некий мутный гибрид из них, пока не упёрлись в вопросы, в которых нужно между этими концепциями сделать принципиальный выбор), а со стороны кибернетики (чтобы реализовать модель механического собеседника) — до теории фреймов Минского (немношк ослабив связь слов со знаниями в своей модели). И, наконец, дойдёте до открытых вопросов, которые таки действительно ещё не решены в теме симуляции сознательной деятельности (к которой относится и способность поддерживать диалог) — до минимальной модели theory of mind, физического тела и среды, до проблем обучения и подготовки данных. (Я тоже свой путь к Матрице начинал с чатботов :).)

Формальных правил, даже логических, в нашем мозгу, судя по данным из нейронаук, нет. В нас есть некие «стистические разрешатели входных параметров», которые и соотносят дерево с лесом так же, как планету с солнечной системой. Формулы «x => y» или «x > y» являются продуктом нашего мышления и поступают на вход статистического разрешателя ровно на тех же правах, что и остальные внешние сигналы, и формулу сравнивать с деревьями мозг будет по такому же волшебному статистическому принципу (описанному Розенблаттом), «примеряя», насколько та или иная формула «похожа» на другие образцы. Вчера «шар помещён на верхнюю плоскость куба», сегодня «арбуз лежит на столе», а завтра «на старом кухонном столе лежит моё любимое лакомство, которым я с тобой готов поделиться».
Формальных правил, даже логических, в нашем мозгу, судя по данным из нейронаук, нет.
Что за бред вы городите?) Если бы правил не было, то даже самое минимальное понимание сапиенсами друг друга стало бы невозможным. И если что, нейронауки к информации имеют такое же отношение, как биология к математике, а может и того меньше...
которые и соотносят дерево с лесом так же, как планету с солнечной системой
Поздравляю, вы таки нашли логическое правило. Одно из. Теперь найдите еще 50 оставшихся.
и формулу сравнивать с деревьями мозг будет по такому же волшебному статистическому принципу
Ну бред же городите) Откровенный. Совсем не стесняясь. Родитель говорит дитю — это лес. А это дерево. И пальцем тычет на то и на другое. Пока дитё верно не будет распознавать то и другое, так и будет тыкать. Нет?) Так кто сравнивает лес и дерево? И какая нафиг разница, что в чем и где? Это же другой вопрос… У вас все смешалось зачем-то) А зачем?
Когда вам показывают на луну, вы смотрите на палец, а не луну, кажется. Ещё никогда так буквально уместной не была моя присказка :).
кажется
Так покреститесь. Говорят, помогает.
Я имел ввиду следующее: в мозгу нет в явном виде грамматических или логических правил, по которым мы формируем предложения, но в мозгу есть некие генеративные (порожадющие) модели, эпифеноменально приводящие к поведению, трактуемому наблюдателем как логическое и грамотное.
в мозгу нет в явном виде грамматических или логических правил
в мозгу есть некие генеративные (порожадющие) модели
Вы сами понимаете сей фееричный бред?)))) Вы одно непонятное заменили другим непонятным, и делаете вид, что вам все стало понятно?
Вежливее бы прозвучало «объясните мне, пожалуйста, что такое генеративные модели, я не понимаю этого термина». И наверняка бы даже кто-нибудь нашёл интересным такое объяснение дать.
Вы вежливость заменяете термином «лизание ачька»? Объяснюсь) Вы хотите, что бы я озвучил факт того, что я ничего не понял, и слезно попросил у вас объяснений припав на коленку?)))

Слушайте, вы себе льстите ну просто в каких-то нереально гигантских масштабах) И конечно же не понимаете этого.

А суть простая. Если вы что-то там заявили, так вы и объясняйте. Причем вы то ждете что вам «ачько отлижут» за это, а на самом деле может и пинок прилететь))))

И более того, как бы вы не «объясняли» что либо чем либо что вы считаете «объяснением» — так у вас изначально ничего не выйдет) Ну потому что если бы вменяемое объяснение было, то все давно бы стало понятно не? А если все вовсе не понятно, то ваши объяснения изначально пшык, какие бы «объяснения» вы не приводили бы. Понятно нет?
Я вот всё понял, но вы не совсем правы, а местами и совсем не правы :)
Сначала простые примеры:
Для проверки сказанного и написанного люди могут использовать явным образом сформулированные формальные грамматические и логические правила, а также словари написаний и произношений (находящиеся в голове), которые есть формальные правила переписывания с одного языка (внутреннего-мысленного) на другой (внешний). В том числе, они используются и при формировании предложений.
При построении условных конструкций при формировании предложений конечно же используются правила логического вывода.
Практически всё эмфатическое общение использует формальный язык: услышал в речи собеседника какое-то слово или понятие, распознал эмоцию, откомментировал своим опытом или канонической уместной в данных обстоятельствах фразой (простейший пример: «представляешь, а я вчера гуляла и упала» — «ой, бедняжка»). Поэтому подобный уровень общения отлично моделируется чат-ботами (неудивительно, правда?).
Заметим также, что генеративная модель вполне себе описывается формальными правилами, и то, и другое — абстракции, т.е. явно не наблюдаемые в мозгу сущности, поэтому говорить, что одного нет, а второе есть — неправильно, это как говорить, что у вас дома овощей нет, а огурцы есть :)
И вообще, практичнее говорить «вот то-то можно удобно описать генеративной моделью», а не «вот то-то является генеративной моделью». Практического смысла от фразы «весь мир/мозг/компьютер — генеративная модель» — ну вот совсем никакого.
Вы не поняли моего ответа. Но в целом, да, любая истина — лишь удобство интерпретаций и возможность формулирования предсказательных моделей. И иногда это «удобство» — не прихоть, а математическое гёделевское ограничение.
>Вы не поняли моего ответа.
Не только я один. Так что всё же попробуйте переформулировать, чтобы было понятно, что вы имели в виду. Я до сих пор не понял, видимо, что вы имели в виду, если то, что вы сказали — не то, что вы имели в виду, но что вы имели в виду на самом деле вы так и не сказали :)
Но вот только не надо в псевдо-философию съезжать. Никакой Гёдель, вертящийся в гробу и чертыхающийся от количества неправильных пониманий его теоремы, не мешает человеку решать прикладные задачи (а вроде бы по вашей логике должен, так же как в советском подростковом фильме «Москва-Кассиопея» робот от нерешаемой задачи самовзрывается, ну и ещё много где обыгрывается эта тема).
Уважаемый автор, Вы слыхали про Дескрипционную логику, «Онтологическую модель представления знаний», OWL, автоматическое доказательство теорем?

А слыхали про Prolog? Он уже 1970-х давал ответ на Ваш вопрос:
машут ли какаду в полете крыльями?

Советую вначале прочитать Википедию:
  1. Дескрипционная_логика
  2. Proof_assistant
  3. Cyc 1984 год

Типичным примером знаний в базе CYC являются «Всякое дерево является растением» и «Растения смертны». Если спросить «умирают ли деревья?», машина логического вывода может сделать очевидный вывод и дать правильный ответ. База знаний (англ. Knowledge Base или KB) содержит более миллиона занесённых туда людьми утверждений, правил и общеупотребительных идей.

Уважаемый рецензент! Если вы хотите указать на пробелы в моих познаниях, они очевидны. Ознакомиться со всеми опубликованными материалами и выдвинутыми концепциями невозможно. До многого приходится доходить интуитивно, так быстрей. Однако замечу: статья не столько о составлении базы знаний, сколько о сведении сложных понятий, в особенности абстрактных, к элементарным, основанным на ощущениях. В материалах, на которые вы сослались, данной тематики (того, что первичными должны быть именно ощущения) я не уловил, возможно в силу сложности материала и недостаточного знания английского. В целом любопытно, конечно. Даже впечатляет. Однако чего вы от меня хотите? На то, что каждое мое слово уникально и единственно в своем роде, я не претендовал. Если я походя высказал пару идей, разработанных западными лингвистами полвека назад, простите великодушно, со всяким бывает. Если вы укажете на концепцию, которая сводит абстрактные понятия к ощущениям, я совсем устыжусь.
Простите, совершенно не хотел Вас упрекнуть.
В целом прочитал 3 Ваших последние статьи и они мне понравились.
В действительности, Вы сделали довольно интересные выводы.
И мне хотелось показать Вам, целый пласт научных исследований, которые остался в тени хайпа Машинного обучения и Нейросетей.
Я тоже в свое время пришел к идее построение символьного моделирования мышления применяя логический вывод. Пытался разработать базовую модель, чувств:
свел их к 2м базовым категориям {боль; приятно}, {интересно; индифферентно}.
Потом пытался написать алгоритм логических выводов смеси темпоральной и нечеткой логики.
Возможно Вы читали, может нет, но есть огромное количество статей и строгих доказательств, тупиковости логического и символьного подхода к ИИ. Попытки классифицировать все объекты и свойства, и ограниченности логических выводов на таких базах знаний. Хотя такая методология успешно применяеться в экспертных системах особенно в области медецины и биологии.
И в отличи от Вас, мои идеи дальше экспериментов и размышлений в душе (яркий пример который приводит символьную машину вывода в замешательство) не обрели материального воплощения.
А вы пишите интересные статьи.
Да я и не обиделся — просто ответил в вашей же интонации.
Понимаете, в чем дело: ИИ — не моя специальность. По своей специальности я прочитал горы книг, но сейчас мне интересен ИИ, а знакомиться с литературой по данной тематике нет времени. Однако у меня есть наработанная философская база, от которой можно отталкиваться в рассуждениях об ИИ: используя собственную, а не общепринятую терминологию, попутно изобретая велосипеды и проч. На это мне указывают в комментариях к почти каждой статье, и я знаю, что это правда, но что поделаешь?! Я всего лишь пытаюсь привести мысли в порядок.

За комментарии спасибо, кстати. Люблю беседовать со специалистами, особенно если они не просто возмущаются, что профан залез в их епархию, а указывают на фактические промахи и нестыковки.

Пытался разработать базовую модель, чувств:
свел их к 2м базовым категориям {боль; приятно}, {интересно; индифферентно}.

Да, у меня аналогичная идея была, почти аналогичная. Правда, до реализации в чат-боте не дошло — наткнулся на непрошибаемую стену раньше, чем до этого добрался. Все мы из одного источника черпаем — кто сколько сможет.
Еще хочу добавить: По настоящему этот подход не настолько глуп и не безперспективен. Дело в том, что мониторинг статей (на arxiv.org, researchgate.net) по ключевым словам Decision-making, Fuzzy Temporal Logic, Temporal representation, Reasoning in Artificial Intelligence, показывает, что это новая старая тема вновь становится популярной в узких научных кругах и прикладной области Natural Language Processing.
Поддержу обе стороны: действительно, сложность науки и сергегация по уровням знаний такова, что научные группы изучают и исследуют результаты работы других научных групп как некое природное явление, переоткрывают математические и физические законы заново. И эмоция «баян» — это то, чем платит такой исследователь за получение новых знаний :).
Sign up to leave a comment.

Articles