Комментарии / Профиль assembled / Хабр

Про любой язык можно сказать, что программа на нём состоит из лексем (слов) следующих друг за другом. ;)

Например есть слова которые начинают какую-либо конструкцию и сответствующие им завершающие слова, типа : NAME ... ;, CODE name ... ENDCODE и управляющие конструкции, разве они в совокупности не образуют синтаксические конструкции?

В добавок и лексическое строение в виде слов, разделяемых пробелами, нарушается уже стандартными словами для строковых литералов, комментариев и т.п. слов, захватывающих произвольную часть исходника, что уж говорить о пользовательских словах.

Посмотреть

Универсальный DSL. Возможно ли это?

assembled 7 дек 2019 в 20:08

Конечно можно, почему нет? Судя по всему вы спорите о том, чего не знаете.

Как я уже сказал, в форте есть полный контроль над разбором текста прямо во время этого самого разбора, это слова:

SOURCE — адрес и длина текущей интерпретируемой строки;
>IN — переменная (доступна и для чтения и для изменения) хранящая смещение первого непросмотренного символа от начала строки;
REFILL — прочитать следующую строку из входного источника.

Мне кажется уже этого достаточно для того, чтобы придумать синтаксис какой только в голову взбредёт.

В добавок есть слова для парсинга: WORD PARSE
для создания словарей: WORDLIST VOCABULARY
для поиска слов: FIND SEARCH-WORDLIST
для управления контекстом поиска: GET-ORDER SET-ORDER ALSO ONLY PREVIOUS

Посмотреть

Универсальный DSL. Возможно ли это?

assembled 4 дек 2019 в 22:14

В форте семантика влияет на синтаксис. Форт не регулярный язык, его нельзя разобрать конечным автоматом.

Пример попроще:

( это комментарий, транслятор его игнорирует, а вернее это делает слово "(" )
: ( ;  \ переопределение слова "("
( такого синтаксиса для комментария у нас больше нет, никто ничего не пропустил, и интерпретатор попытается выполнить эти слова, и произойдёт ошибка)

Вы сможете описать это хоть какой-нибудь грамматикой?

Посмотреть

Универсальный DSL. Возможно ли это?

assembled 4 дек 2019 в 18:40

У форта неограниченная грамматика: все части форт-системы (даже такие как интерпретатор и компилятор) являются самыми обычнымм определениями на равне с другими форт-словами и могут быть изменены, переопределены и вызваны в любой момент, также исходный текст программы и состояние интерпретатора доступны прямо во время исполнения для чтения и изменения. Возможно придумать любой синтаксис на какой только хватит фантазии программиста и памяти системы.

Например здесь синтаксис зависит от введёного символа:

: PARSE&TYPE  ( c "ccc<char>" -- c-addr u )
    ." PARSED: " PARSE TYPE CR ;

: AAA ." AAA CALLED" CR ;
: BBB ." BBB CALLED" CR ;

\ ограничитель - символ '1'
.( TEST 1:) CR
CHAR 1 PARSE&TYPE AAA 1 BBB 2 CR

\ ограничитель заранее не известен
.( TEST 2:) CR
KEY PARSE&TYPE AAA 1 BBB 2 CR
.( TEST 3:) CR
KEY PARSE&TYPE AAA 1 BBB 2 CR

BYE

Try it online!

Форт также может быть сам себе препроцессором и так иногда делают, но часто проще сразу скомпилировать нужный код чем заниматься подстановкой текста.

Посмотреть

Универсальный DSL. Возможно ли это?

assembled 3 дек 2019 в 15:46

Да, оксюморон получается. Но, наверное, к форту вполне это определение подходит, сам форт язык универсальный, но программирование на нём обычно сводится к определению новых слов и конструкций, специфичных для решения конкретной задачи.

Посмотреть

«Замести следы и уйти на выходные»: как удалить себя из большинства популярных сервисов

assembled 30 ноя 2019 в 16:12

Лучший способ замести следы — это не оставлять их.

Посмотреть

Fake News: как создаются фейковые новости и можно ли их распознать

assembled 30 ноя 2019 в 16:05

ШОК! СЕКС-ИГРУШКИ ЗАБАСТОВКАМИ ДОБИЛИСЬ ПРАВА ВОДИТЬ АВТОМОБИЛЬ!

ЧИТАТЬ ДАЛЕЕ >>>

Посмотреть

Мышь, поставившая крест на проводных собратьях

assembled 25 ноя 2019 в 15:20

Не понимаю смысла беспроводной клавы, она почти всё время неподвижно стоит на столе. На кой чёрт ей быть беспроводной?

Посмотреть

Публичные данные 1,2 млрд пользователей были обнаружены на открытом Elasticsearch-сервере

assembled 23 ноя 2019 в 18:08

О, господи! Кто-то собрал данные о нас, которые мы сами же и публиковали в интернетах!

Что же тепепь делать? Как быть?

Посмотреть

Розеттский код: измеряем длину кода в огромном количестве языков программирования, изучаем близость языков между собой

assembled 15 окт 2019 в 20:05

Тут и кроме пробелов остается довольно много символов:

tokens[str_String]:=DeleteCases[StringSplit[str, Complement[Characters@FromCharacterCode[Range[1, 127]], CharacterRange["a", "z"], CharacterRange["A", "Z"], CharacterRange["0", "9"], {"."}]], ""];

Подсчет токенов работает неправильно даже в вашем языке. Например здесь:

tokenCount[str_String]:=Length[tokens[str]];

ваш «токенизатор» насчитал 6 токенов. Это не токенизатор, он работает только как счетчик идентификаторов в Mathematica, и к другим языкам не применим.

P.S. Еще как оказалось во многих решениях на APL и J представлен не только код, а копия команд из REPL'а и их результат. Так, например, транспонирование матрицы на J плюс вывод созданной матрицы размером 5 строк, плюс результат транспонирования размером 4 строки, превращается в 11 строк, при том что реального кода здесь 2 строки.

Посмотреть

Как Яндекс научил меня собеседовать программистов

assembled 15 окт 2019 в 18:59

Очень жаль, что у вас такая каша в голове. Коллбэк не имеет никакого отношения к асинхронщине.

Даже педивики говорит:

Callback (англ. call — вызов, англ. back — обратный) или фу́нкция обра́тного вы́зова в программировании — передача исполняемого кода в качестве одного из параметров другого кода.

Что мы делаем? Передаем исполняемый код (эту лямбду) в качестве параметра в другой код (в reduceRight). Подходит под определение выше?

Посмотреть

assembled 15 окт 2019 в 18:36

Насчет токенов. Вы считаете неправильно и нечестно, многие языки имеют совершенно разное лексическое строение. Например:

вы не учли знак подчеркивания в именах
вы не учли строки
многие си-подобные языки позволяют использовать знак доллара в идентификаторах
в перле у идентификаторов используются префиксы из спецсимволов, в старых бейсиках — суффиксы
в типичной программе на APL, J или K буквы встречаются не часто :)
кстати, сколько токенов ваш парсер насчитает в brainfuck'е?
в форте и ему подобных в словах используются любые печатаемые непробельные символы, и это только в простом случае, т.к. в форте программа может сама парсить свой текст в общем случае чтобы разбить его на токены его понадобиться выполнить
наконец на Rosetta Code часто можно встретить хорошо комментированный код, это немного портит и правильность подсчета строк и симолов

Посмотреть

bear_hug: игры в ASCII-арте на Python3.6+

assembled 10 окт 2019 в 18:21

Все таки это не ASCII-арт, а просто псевдографика. В ASCII нет никаких рамочек и т.п.

Но получилось красиво.

Посмотреть

Как Яндекс научил меня собеседовать программистов

assembled 9 окт 2019 в 23:30

Какая асинхронщина? Вы о чем?

Этот «кусок кода» — содержимое функции передаваемой в reduceRight. Функция, передаваемая в другую функцию для последующего вызова называется callback, если вы не в курсе.

И да, я также считаю, что код трудночитаемый, но совсем не из-за r[0][0], а из-за вложенного тренарника и использования && для ветвления; вложенные условия человеку всегда тяжело анализировать, особенно если записать их в одно выражение. В добавок первое условие r.length (или, если более явно r.length != 0) выполняется только в первый раз, и можно было передать этот элемент вторым аргументом в reduceRight, а из массива его исключить. Когда читаешь код, обычно пытаешься мысленно его выполнить, а лишние условия только сбивают с толку.

Посмотреть

Нескучный туториал по NumPy

assembled 8 окт 2019 в 19:59

Кстати, существуют языки программирования изначально ориентированные на обработку массивов, например APL или J. Они еще и очень лаконичные, большинство ваших примеров можно записать в одну-две коротенькие строчки.

Если интересно вот есть простой туториал по J.

Посмотреть

Как Яндекс научил меня собеседовать программистов

assembled 8 окт 2019 в 19:17

От ассемблера зависит. Как директива препроцессора наверное почти везде есть. На многих их можно реализовать на макросах. В форт-ассемблерах почти всегда есть высокоуровневые конструкции из форта.

Посмотреть

Как Яндекс научил меня собеседовать программистов

assembled 8 окт 2019 в 19:01

Здесь нет никаких магических чисел, r[0][0] это первый элемент первого массива результата предыдущих применений этого коллбэка. Это довольно очевидно.

Или вы предлагаете ввести константу FIRST_ARRAY_ELEMENT?

-1

Посмотреть

2 3 ...

6 7