Как стать автором
Обновить

Комментарии 21

Кодил на Питоне…
Под весенней сакурой
фуриганайзер
| Каной, в принципе, можно написать всё. Давным-давно, собсвенно, так и делали. Пока в один прекрасный день не захотели чего-нить позатейливей и не позаимтсвовали из Китая иероглифы, которые мы будем дальше называть кандзи, потом что они так называются.
А теперь идём в Википедию и узнаём правду: «The first kana was a system called man'yōgana, a set of kanji used solely for their phonetic values, much as Chinese uses characters for their phonetic values in foreign loanwords (especially proper nouns) today. Man'yōshū (万葉集), a poetry anthology assembled in 759, is written in this early script. Hiragana developed as a distinct script from cursive man'yōgana, whereas katakana developed from abbreviated parts of regular script man'yōgana as a glossing system to add readings or explanations to Buddhist sutras.».
Да и вообще, не увидеть в кане упрощённые скорописью иероглифы это надо каким-то особенным зрением обладать.
Чтобы увидеть в кане упрощенные канзи — мне кажется нужно как минимум посмотреть пару примеров с последовательным упрощением последних в специальной книжке.

Кана действительно произошла из китайских иероглифов, причём довольно давно, в V-VII веках — и стала доступной широким массам формой письменности. Посмотрите на один из ранних литературных памятников, повесть о Гэндзи ( X-XI) — написана каной. Да, женщиной, но от мужчин одни сутры остались. Кандзи использовались для сутр и подобного, простые люди пользовались каной, в моём наивном представлении. До языковых реформ которые установили смешанную форму письменности. Еще раз, что я сказал: одной каной можно написать любую фразу на японском — верно, сейчас используется смешанный скрипт с каной и производными от китайских иероглифов — верно.

Действительно я неаккуратно выразился в том смысле что переход на кандзи — это не изначальное заимствование оных из китайского. Спасибо что донесли правду ;)
Ну, думаю, если показать японский текст человеку, который до того с японским делом не имел, он не станет разбираться и сходу назовёт всё «иероглифами». Даже если там не будет ни одного кандзи. :)
А последовательное упрощение нужно далеко не для всех. Скажем, 己 в こ (который часто пишется слитно) или 寸 в す, можно сказать, напрямую при быстром письме переходят.
ОК, полезная вещь. А скрипт не будет путать он-ёми и кун-ёми? Как дело с этим обстоит в случае с идущими подряд канджи?
В основном корректно работает. 水[すい]田[でん]をみる.水[みず]をのむ.
Оно же не отдельные кандзи «озвучивает» — mecab разбивает на «слова», kakasi видит что пришла группа кандзи и берёт китайское чтение в этом случае. Неточности возникают, когда следующее слово должно было бы, например, чуть-чуть изменить озвучкку согласного в предыдущем.
Неточности с рендаку?
Я конечно понимаю, что статья про японский, но обилие слов паразитов типа «собсно» и каких-то очевидных опечаток типа «начать ими писать было не можно» затрудняет чтение. Да и манера изложения со всякими «Фух», «Ну и наконец» создает впечатление будто вы статью из-под палки пишете (ИМХО).
Отнюдь. Как будто последнее дыхание мёртвого хабра.
Хм, мне скорее казалось неловким такой длинный текст на читателя вываливать, так что я добавил пару «ну и наконец» в этом смысле. Впрочем на обладание литературным талантом я совсем не претендую, да и по-русски, по большому счёту, не писал и не говорил уже лет шесть :)
Ну и в каком-то смысле может быть из-под палки — всё руки не доходили, пока не сказал «сколько ж можно уже»
Простите за критику, но было бы неплохо, если бы вы ознакомились с PEP8 (https://www.python.org/dev/peps/pep-0008/).
В текущем виде код местами практически не читаем.
Вам самому будет намного легче разбираться в нём, если оформление будет пусть даже и не строго по PEP8, но хотя бы единообразно.
Нет мне прощенья, как говорят японцы.
На самом деле код на 90 процентов скопирован «с миру по нитке», взаимодействие с консольным софтом — в основном с Anki, например.
Будем время — попробую немного его причесать.
Создал пулл реквест.
Впринципе можно убрать множество продублированного кода, организовав наследование.
Но я бесконечно далёк от темы и боюсь не смогу протестировать изменения)
в аду для перфекционистов
ни серы нету ни огня
а лишь слегка несимметрично
стоят щербатые котлы

я смотрю что вы поменяли в своём форке — пробелы вокруг операторов в основном. Вот если честно, ни разу они мне не помешали понимать код, который кстати написал не я — это фрагменты как раз в основном из Anki (очень, кстати, замечательной и популярной софтины) — прикрутил к макросу и забыл благополучно :)

В любом случае большое спасибо за труд, я бы с радостью принял ваш pull request, но вы его отправили себе же в своём репозитории…
Ладно, я прогнал сам через autopep8 — эффект тот же. И закоммитил, так что в принципе не актуально. Спасибо еще раз!
Упс… А вот с гитхабом пока дружу не сильно, больше с геритом) Что там нужно было делать, что бы отправить пул реквест вам, а не себе?

Это не сколько перфекционизм, сколько профессиональная деформация.
Когда бегло смотрю на:
res= str(self.kakasi.stdout.readline(), «sjis»).rstrip('\r\n')

Воображение услужливо дорисовывает:
def res= str… # < — начало объявления метода-сеттера в Ruby.

Прошу прощения за излишние придирки)
ну я с Ruby не знаком :)

Вы на гитхабе сдели бранч у себя, поэтому он вам по-умолчанию предложил, вероятно, мёрджить (grammar-nazi меня расстреляют точно за количество запретных слов в этом предложении ><) в ваш master, а там же рядом была по-идее ссылка «compare across forks» после которой можно было бы выбрать из какого форка (вашего) в какой (в мой)

может быть если нажимать pull reqeust в моём репозитории — то будут другие умлочания, не уверен…

p.s.
пойду остальные проекты по-autopep8-лю…
Нет мне прощенья, как говорят японцы.
На самом деле код на 90 процентов скопирован «с миру по нитке», взаимодействие с консольным софтом — в основном с Anki, например.
Будем время — попробую немного его причесать.
Это офигенно! Хочу плагин к браузеру, который делает тоже самое.
для браузера (у меня в фаерфоксе и thunderbird-е стоит) есть rikaichan — делает даже больше, в смысле показывает перевод. Я собственно так японский в-основном и читаю: незнакомые кандзи можно посмотреть быстро, наложить на свои знания общей грамматики и быстро всё понять. Для сравнения гугл-транслейтом была бы полная каша.
Давно же есть. IPA furigana для Хрома, Furigana Inserter для Лисы
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории