Комментарии 68
В качестве спин-оффа к статье может подойти фантастический рассказ Теда Чана «История твоей жизни». По нему снят фильм «Прибытие». Автор рассматривал взаимодействие языка (письменного и устного) с окружающим нас миром и в других своих произведениях.

Спасибо за качественный перевод хорошей статьи.
Нарядно, спасибо. Алфавит Iţkuîl, кажется, видел в каком-то из фантастических сериалов.

Вроде никто так и не смог.
Даже последнюю редакцию которая раньше была Илакш.
До чего заманчивая идея и по видимому неосуществимая.

А что в ней такого заманчивого? С самого начала было очевидно, что в массовом языке не может быть 100 звуков и пары сотен грамматических форм. Или мы сочиняем язык для людей, или для роботов, но тогда можно с тем же успехом сделать там 1000 звуков и язык станет еще компактнее.

Так дело совсем не в том что Ифкуиль/Илакш "сокращает" количество звуков, а в том что теоретически позволяет передавать очень сложные смыслы крайне точно и однозначно.
И даже когда выражаешь неявные вещи (несколоко слоёв смысла, сарказм) в языке есть способы выразить это очень точно.
Именно такое впечатление он у меня оставил.
В теории это мне очень импонирует.


При этом я знаю что есть очень "точные" языки например Логлан/Ложбан, но нет у них этакого налёта псевдонаучной романтики.

Моя попытка изучить Логлан разбилась при первой попытке им воспользоваться. Нет терминологии. Вот как перевести хоть на Логлан, хоть на Ифкуиль понятие «индекс ГРАУ»?
Сами придумайте. Десять человек в мире, говорящих сейчас на Логлане, очевидно никогда не сталкивались с этим индексом.
Так они, судя по языку, вообще ни с чем, выходящим за рамки светской беседы, не сталкивались. На логлане даже комменты к коду писать невозможно — терминологии нет.

Для этого надо взять привычку заменять символ (слово) на суть (определение). Это в принципе хорошая привычка — понимать что именно ты сейчас хочешь сказать — но для логических и сильно синтетических языков необходимость.


Далее, надо иметь в голове кэш лексикона и грамматики, но на первых порах хватит и открытых вкладок в браузере.


Теперь, что есть индекс? Википедия сообщает: "условное цифро-буквенное обозначение образца вооружения". На эту тему есть основание -D- ‘NAME/DESIGNATION/TITLE’, где второй корень это designation/reference + referent; refer to as.
ГРАУ это имя собственное, так что оборачиваем в маркер "читать фонетически" и дело с концом.

ГРАУ — это главное ракетно-артиллерийское управление.
Где «управление» — это не процесс, а название подразделения.
Кроме него есть другие главные управления и управления. ГРАУ здесь, как пример.

Это же как МГИМО какое-нибудь переводить. Можно, но смысла большого нет. Какой-то полезной информации оно не гарантирует, а узнаваемость потеряется.

Замечательно. Допустим, ГРАУ — это имя собственное. А как службы ракетно-артиллерийских вооружений, которая в каждом округе своя?
Это возвращает нас к проблеме перевода таких понятий, как «служба», «часть», «управление» и иже с ними.

Какая с ними проблема? Службы, части и управления, так же, как и прочие взводы и батальоны должны отлично выражаться через Configuration и Affiliation в отношении своего назначения и/или формы, если это важно.

Ммм… Взводы и батальоны, так же как службы и управления, — это не про назначение. Это про ранг в «матрёшке».

Ну, вот, как, к примеру, выразить слово «полк» (самое простое, потому что административно-хозяйственная единица)?

"нужно больше контекста" (с) все переводчики (=


Я могу попробовать, но в интерактивном режиме, в какой-нибудь телеге. Очень уж деталей и нюансов много может вылезти, а я не особо в теме.

Собственно, проблема-то в этом и есть. Если живьем общаешься с носителем языка, который, при этом, хоть чуть-чуть знает твой язык — можно понять все и договориться о всех нюансах.
А вот просто начинаешь копать китайские 100 тысяч войск… Внезапно оказывается что 10 — это «плюс» «сложить» «собрать вместе», а иероглиф «10000» — это, вообще-то, «очень много». Т.е. больше двух. Т.е. «300-тысячная армия напала на императора» из «древних рукописей» вдруг оказывается «собрались три гопника пограбить соседа...»
Ифкуиль/Илакш «сокращает» количество звуков

Одной из заявленных Кихадой целей была проверка, какого уровня компрессии можно добиться в человеческом языке.

позволяет передавать очень сложные смыслы крайне точно и однозначно


В проектировании языка есть фатальная ошибка. Указывать все эти сложные смыслы язык требует в обязательном порядке, даже когда они не нужны. Не по мере необходимости, как в китайском и вообще во всех естественных языках, а постоянно, что создает слишком большую когнитивную нагрузку даже в самых простых случаях.

Второй недостаток — сильная похожесть падежей и прочих морфологических показателей, которые различаются обычно одним-двумя звуками. Поэтому их невозможно запомнить и очень сложно расслышать.

Опять же, естественные языки делают эти различия гораздо более явственными.

Точно так же Кихада спроектировал и письменность — из одинаковых палочек.
которые различаются обычно одним-двумя звуками

Этим же страдают lo**n'ы. Практически нет избыточности кода.
Браун по крайней мере знал об этой проблеме и убрал сочетания звуков, которые при беглой речи похожи на другие.

Очевидно, в остальных случаях он предполагал, что все будет произноситься очень четко.

В случае Логлана с 5-6 гласными это явно проще, чем в Ифкуиле, где можно вывихнуть себе челюсть.

Со всеми пунктами соглашусь на 100%.
Язык проектировался без оглядки на шум среды и на возможности основного человеческого канала связи для естественных языков.
Но сама идея меня восхитила.
Несмотря на...

Если вам так нравится эта идея, поглядите тюркские языки. Они именно так логично и сделаны. Наращивание аффиксов добавляет смысл, причем аффиксы независимы.

Пример из турецкого:

gül+mek смеяться (инфинитив)
gül+en смеющийся (причастие)
gül+dür+mek смешить (смеяться + аффикс «заставлять»)
gül+dür+en тот, кто смешит (с этого места уже не хватает морфологии русского языка и приходится прибегать к описательным предложениям)
gül+dür+en+ler те, кто смешат (добавлен аффикс множественного числа)
gül+dür+ül+mek подвергаться рассмешению (страдательный залог)
gül+dür+ül+en+ler те, кого смешат
gül+dür+ül+en+ler+de у тех, кого смешат (+ местный падеж)
Указывать все эти сложные смыслы язык требует в обязательном порядке, даже когда они не нужны.

Нет, не требует. Базовая форма это Vr-Cr-Vc-Ca +тон +ударение. Если этого достаточно чтобы указать на предмет разговора, то и ладно. В русском тоже обязательно указывать кучу категорий, однако мы не сильно то и страдаем (пока не надо пересогласовывать всё предложение, тогда ай).


Второй недостаток — сильная похожесть

В новой ревизии автор уделяет этому внимание. С поправкой на то, что это язык всё же академической беседы и судебных заседаний, а не барного трёпа.


Точно так же Кихада спроектировал и письменность — из одинаковых палочек.

Даже если это и объективно так (что я субъективно не разделяю), то в новой редакции письменность переделывается и становится ещё лучше. При чём курсив сразу же можно использовать в качестве скорописи/стенограммы, а "рубленая" форма ещё больше заточена под калиграфию.

В русском тоже обязательно указывать кучу категорий


Для существительных два — число и падеж, причем они слиты в одну морфему (зависящую от рода).

А в Ифкуиле, как вы сами процитировали, четыре + тон (если он смыслоразличительный).

При этом Ифкуиль нельзя учить постепенно, на нем нельзя сказать «моя твоя не понимать».

Почему нельзя? Просто ставишь всю обвязку в дефолтные позиции и на одних корнях ездишь. Почти везде это будет a-корень-а-l. Дальше можно зубрить корни. Будет такой китайско-ифкуильный пиджин.

Илакш не последняя. Она даже до релиза не дошла в итоге. Автор её дропнул, вернулся к оригиналу и сделал ещё несколько попыток сделать более удобный вариант того же самого. В итоге сказал "ну всё, хватит, вот это и есть финальная версия"… Выпустил книжку, покатался по конфам и затих.


Но, зарекалась ворона кизяки клевать, и автор снова за своё. Недавно опять старая туса с фейсбука переползла на реддит и автор там с толпой фанатов пилят очередную новую ревизию с прицелом на (относительную) простоту обучения.

В отличие английского языка, где используется конструкция «подлежащее-сказуемое-дополнение» (Subject-Verb-Object), в языке майя применяется порядок «сказуемое-дополнение-подлежащее» (Verb-Object-Subject).

Оказывается мастер Йода говорил на древнем языке майя
image

Йода использует в основном нормальное английское SVO, иногда сбиваясь на OSV (напр. Patience you must have, my young padawan). Сказуемое у него никогда не в начале.

Затейники эти майя.
Но, если принять то, что раньше писари и письменность были дорогой услугой, то можно предположить, что тексты майя написаны буквицами.
НЛО прилетело и опубликовало эту надпись здесь
Может быть, не любая, а письменность с увеличивающимся числом пользователей?
Например, латынь вроде бы неизменна, а немецкий прошёл как минимум одну упрощающую реформу.

И вообще я бы к ним наш жизненный опыт и закономерности европейской цивилизации применял с большой осторожностью. Химическое оружие изобрели, операции на мозге, но колесо не открыли (или оставили в прошлом). Затейники!
Дай человеку тачку и он гору перетаскает. Всем колесо впёрлось

Там сильно пересечённая местность, то горы, то джунгли, поэтому колёсики были только у детских игрушек, а грузы возили на вьючных животных. Караван верблюдов в Старом Свете, кстати — штука настолько же рациональная в своих условиях, вот и выдержала тысячи лет конкуренции с колёсным транспортом.

Письменность упрощается только при массовом применении. В исторические времена нередко была выгодна сложная письменность — чтобы в процесс не влезли посторонние, и писцы (или жрецы, например) сохраняли свои привилегии.

Даже для древнерусских источников Зализняк отмечает стремление авторов выражаться витиевато, так, чтобы письменный текст как можно меньше напоминал разговорную речь.
НЛО прилетело и опубликовало эту надпись здесь
С письменностью это получается еще проще — возможности обфускации там огромные. Посмотрите, например, на китайскую цивилизацию, где в чиновники брали только тех, кто выучил иероглифы, — что занимало лет десять.

Как вы думаете, были китайские чиновники заинтересованы в упрощении письменности, чтобы в их элитарный клуб проникли кто попало?
НЛО прилетело и опубликовало эту надпись здесь
Ну так я и говорю о средневековье. Вся тогдашняя иероглифика была чем-то вроде стенографии, придуманной интеллигентными людьми для собственных нужд.

Плюс обучение предполагало не просто знание иероглифов, но еще и знание классических текстов, и умение написать сочинение на духоподъемную тему.

В совокупности все это затягивалось лет на 5-10. «Студент» — типичный персонаж средневековой китайской прозы.
НЛО прилетело и опубликовало эту надпись здесь
Статья интересная, но рекомендую еще: Горькавый Ник «Сказка о русском лингвисте, расшифровавшем письменность индейцев майя»
Интрига и научный поиск!
Поясните, пожалуйста, кто понимает, про фонетику («Этап второй — точное фонетическое чтение иероглифов, поскольку это единственная возможность чтения неизвестных слов, в которых встречаются известные знаки»)? Я приблизительно понимаю, как можно восстановить смысл анализом структуры (условно, — по аналогии с уже известными языками/системами письменности). Но как можно восстановить фонетику языка, на котором никто не говорит? (опять же утрируя, мы спокойно могли бы называть бога — догом, и будущие исследователи выяснили бы из контекста, что именно имеется в виду под конкретным сочетанием символов (молятся — бог, выгуливают — дог), но откуда можно добыть информацию о том, что «б» это именно звук [б], а «д» — [д], а не наоборот?)
Язык майя сохранился до нашего времени. С сильными изменениями, разумеется.

А как он так сохранился, что звучание можно понять, а смысл нужно расшифровывать? Или по точности звучания просто не заморачиваться сейчас?

Примерно как по сохранившемуся русскому языку можно как-то реконструировать древнерусский. То есть, имеются какие-то регулярные соответствия, но в случае Кнорозова найти их было, конечно, адски тяжело. Нужно было как минимум знать современный язык майя в его историческом развитии.
Классический язык майя, на котором и сделаны надписи, вымер. Но есть множество живых языков из той же языковой семьи — майянские языки.
Реконструирование фонетики древних языков происходит как раз с помощью сравнения с родственными языками, про которые что-то известно. Большую роль играют фонетические законы, которые можно выцепить из изменений в письменности самого языка и из изменений в произношении/письменности в родственных языках. К слову, важную роль ещё могут иметь диалекты, в которых могло сохраниться более старое произношение.
Ещё может сильно помочь, если до сих пор сохранились какие-то, скажем, географические названия, которые уходят корнями в исходный язык.
Кстати, реконструировать можно даже те мёртвые языки, для которых и письменность не сохранилась (или её вообще не было). К примеру, есть реконструкции праславянского или праиндоевропейского. Они достаточно надёжны, но мы можем не знать каких-то тонкостей в произношении конкретной фонемы (ну, скажем, мягкость согласного или открытость гласного).
Сложности в реконструкции индоевропейского вы сильно преуменьшаете. Там не то что мягкость неизвестна, но даже толком сами звуки. Реконструкция дает только соотношения между ними, и конкретно для индоевропейского есть несколько разных гипотез насчет самой системы согласных.
Спасибо за перевод, очень интересно.

В качестве дополнения: письменность Майя не была единственной полноценной системой письменности в Америке. Например, не расшированное узелковое письмо инков (кипу) содержит числовые, цветовые, смысловые и языковые символы; оно использовалось как минимум с третьего тысячелетия до нашей эры, и в некоторых отдаленных регионах используется до сих пор.

А как так получается, что используемая до сих пор письменность не расшифрованная? Носители не идут на контакт или никому не интересно?

Те кипу, которые составляются сейчас — малое подмножество того, что существовало во времена империи инков. Носителей осталось единицы. Вроде бы удалось расшифровать числовые символы, некоторые цвета и единичные символы, но основная масса знаков то ли забыта, то ли просто уже не используется. Цивилизации, которую эти письмена описывали, больше нет.
Кипу не записывало слова насколько известно. Все-таки это зачатки письменности
Глуховский — Сумерки. Там про майя и Кнорозова. Впечатляет.
В статье упомянута историю расшифровке языка Майя новосибирскими программистами. Я помню эту историю и мне кажется, это было попозже, уже при Брежневе. Но я не уверен. Хотелось бы понять, что же это было. Нет ли среди читателей таких, кто может послать какие-то ссылки или материалы? Буду весьма признателен.
Загляните в «жежешечку» майяниста Дмитрия Беляева — там по тэгу «Кнорозов» есть несколько публикаций на тему «новосибирской дешифровки»:

Вот что пока нашёл:
maoist.livejournal.com/300993.html
maoist.livejournal.com/84636.html
Я в конце 70-х пытался расспросить некоторых сотрудников ИМ СОАН об этой интересовавшей меня истории, но на меня все смотрели как на невоспитанного юношу, задающего неприличные вопросы.
Пара ссылок для полноты ощущений:

https://maoist.livejournal.com/309078.html
https://maoist.livejournal.com/309452.html

Кроме того, Дмитрий в одном из постов ссылается на статью Кутателадзе, однако приложенная ссылка на поверку оказалась битой. Pdf-файл с текстом статьи гуглится элементарно, но скачивание, как правило, требует регистрации. Зарегистрировался, скачал и продублировал на Mediafire:

http://www.mediafire.com/file/nrogy5epa2g9r0b/kutateladze_s_s_leonid_kantorovich_yuriy_knorozov_i_mashinna.pdf/file
Спасибо за ссылки.
Статья в «Огоньке» написана весьма профессионально, ИМНО. Современным журналистам есть чему поучиться. Становится понятно, что было сделано на самом деле. Моя интерпретация: Изображения вручную были отображены в последовательности неких символов. После этого средствами статистического анализа можно стало пробовать искать шумы. А после их ручной корректировки, на основании имеющегося отображения последовательностей символов в предложения русского языка сгенерировали и распечатали полторы тысячи страниц. Которые видимо и преподнесли Хрущёву.
Из статьи не следует, что авторы приписывают себе методику отображения частей рисунков в символы и последовательностей этих символов в пассажи русского текста. Но и имя Кнорозова упоминается мимоходом.
Возможно, никакой новой Математики при этом открыто не было. Были применены известные методы в новой области. Не надо забывать, что это был 1962 год. Всё, что сейчас называется ИТ, было в зачаточном состоянии. Вместо нынешних терминов Software или Программное Обеспечение использовали термин Математическое Обеспечение.
Другими словами, в работе могло быть много полезного и интересного на тот момент. Было ли, или это была действительно «лженаука» — судить можно только после прочтения работ.
Глубоко уважаемый мной С.С.Кутателадзе, преподававший нам матанализ, к сожалению в свой статье не рассказал, в чём суть лженаучности этой работы. Большая часть его статьи — это выписка из протокола заседания ОУС НГУ. Суть работы там (на заседании) не обсуждается, а уважаемые люди спорят по тонкому формальному вопросу. К сожалению, выглядит это всё не очень солидно. Наверное это было просто эхом оставшихся за кадром позиционных войн за посты, ставки, финансирование.
Разумеется, речь о дешифровке в строгом смысле этого слова не идёт. Это была автоматизированная транслитерация. Но наверное, они «дешифровали» какие-то наборы картинок, до которых у Кнорозова руки не дошли. Так что с точки зрения обывателей и политиков это можно назвать «дешифровкой».
Интересно было бы почитать о современном состоянии автоматического дешифрования мёртвыхи и редких языков. Пока в переводе слишком много людского произвола.

В принципе, ещё одной точкой зрения на историю с новосибирской «дешифровкой» может быть кнорозовская биография в авторстве Галины Ершовой — вот только книгу издали всего несколько месяцев назад микроскопическим тиражом и из продажи она очень скоро практически исчезла.

Хотя, быть может, я просто плохо искал.

PS Статью о Кнорозове в русской «википедии» основательно расширили — судя по всему, как раз с оглядкой на ершовскую книгу. Так что конкретики по казусу с «машинной дешифровкой» там заметно прибавилось.
Удивлён, что не было коммента «Учёный кот и его человек» — к фото Кнорозова с Асей.
Так вроде непременный комментарий — это «Кнорозова вижу, а что за мужик его держит»?
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.