Pull to refresh

Comments 56

… интересно, автор хотел потроллить на тему аннексии или таки тема про переводы.

… можно почитать комментарии и статьи автора, чтобы проверить а) на предмет троллинга б) на предмет отношения к "политическим" дебатам в общем и оффтопу в частности...


Относительно статьи, и конкретного перевода конкретной фразы, хоть мне по множеству причин (в том числе и потому что я — русский, и как ни странно, любящий родину патриот, хоть и живущий не в России) не нравится подобный вариант перевода… Но:


  • это всё-таки фэйл (независимо от моего или вашего отношения к упомянутой теме);
  • баян не мой;
  • статья немного не про то (просто пример показателен);
  • я утрирую, но если допустим переведя на язык (на котором я вообще не говорю, чтобы оценить качество перевода), фразу "пошлите реквизиты на мыло", гугль-транслейт пошлет моего собеседника на-три-бу, уловив прочную связь между "послать" и "на", то… как вам такой вариант троллинга.
как раз наоборот — нейронная сетка гугла адекватно переводит смысл (т.н. «читаем между строк»), так что пока «пошлите реквизиты на мыло» не стало устойчивым, она будет переводить его буквально (попробуйте «США присоединили территорию» — будет тоже annexed)
У нас с вами разные понятия слова «адекватно». Добавьте для примера в конце в русский вариант «в 1783 году»… Что-то поменялось?

Про территории же — это мимо, ибо вы пытаетесь той же «ошибкой» перевода оправдать предыдущую. В русском языке к счастью есть как слово «аннексировать», так и словосочетание «осуществлять аннексию» и т.д.

Если человек написал «присоединила», то я для этого слова и в английском и в немецком кучу устоявшихся выражений могу подобрать, и среди них ну никак не будет «политически» корректного по вашему мнению слова.
то есть, когда вы видите в официальных новостях «уничтожили террористов» рядом с «убийство борцов за независимость», то это вас не удивляет, а когда то же самое умеет делать нейронная сетка, то «epic fail»?
То не «умеет делать нейронная сетка», а делает сервис, претендующий на (дословно) «повышение точности перевода».
Если для вас это более точно, флаг вам в руки…
В данном случае «более точно» == «ближе к тому, как перевёл бы человек».

И тут я бы скорее поаплодировал успехам Гугла, чем огорчился им.

А Doublespeak, как вам уже сказали — это не проблема Гугла, Гугл в данном случае — всего лишь зеркало того, как люди переводят и думают…
По поводу «более точно» == «ближе к тому, как перевёл бы человек», улыбнуло, спасибо… Я «поаплодировал» вашим успехам в словоблудии.

Про остальное же..., по моему скромному мнению double standards занимаетесь как раз вы, т.к. пытаетесь одно и тоже действие называть разными словами… Я не против, но… или трусы, или крестик.
Переводчик не должен делать правки. Если фраза не имеет контекста, то должна переводиться буквально. Переводчик не знает, откуда взята фраза — относится ли она вообще к реальному миру или вымышленному.
Если фраза не имеет контекста, то должна переводиться буквально.

Буквально же не всегда выйдет, есть ведь частота смыслов слов и какой-то контекст на основе стоящих рядом слов чаще бывает. И живой переводчик чаще понимает, какое слово подойдет лучше.

Мое впечатление — последнее время Гугл стал хуже переводить, он выискивает какие-то одному ему известные варианты перевода и зачастую перевод вообще не имеет смысла. Конечно для уверенного заявления нужно иметь один и тот же текст и проверять его раз в пару месяцев, потому это только впечатление.

Тот же пример выше, если его сделать неграмотно, выдаст:
США присоединили Техас — The United States joined Texas
США присоединил Техас — The United States has annexed Texas
Гугл бы лучше занялся проверкой грамматики хотя бы на уровне согласования слов, тогда и переводы будут лучше выходить.
Мое впечатление — последнее время Гугл стал хуже переводить,
когда жалуются на то, что машинный переводчик не улавливает тонкости грамматики и контекста, то это напоминает
недовольство от путешествий самолетом

есть ведь частота смыслов слов и какой-то контекст на основе стоящих рядом слов чаще бывает.
Потому я и сказал, что буквально переводится фраза, а не каждое единичное слово в ней. Мой основной пойнт в том, что нельзя тащить какой-то внешний специфичный (пусть даже более популярный на текущем отрезке времени) контекст.

Про качество гуглопереводов согласен. Пользуюсь reverso, если нужно что-то контекстнозависимое.
На самом деле — нет, даже если нет контекста, предложение редко можно перевести дословно… Просто поверьте (я очень долго занимаюсь этой темой, причём на хорошем уровне для многих языков, особенно германской группы).
Например, «Das Leben ist keine Einbahnstrasse» переводится с немецкого не как «жизнь — не улица с односторонним движением», а «жизнь бывает трудна» и т.п.
Но… Перевод одного и того же с подлежащим и дополнением одного класса, причем однозначно (государство/страна и территория/гео-субъект) с одинаковым сказуемым — по разному — это нонсенс… Даже если вся пресса мира (а это не так, поверьте) вам говорит об обратном… И даже какая никакая устойчивость выражения (с точки зрения той же прессы) не даёт ни в коем случае никакого основания заменять слова таким не равнозначным «алиасом», от слова СОВСЕМ. Просто потому, что железка, на основании такого текста, не может и не имеет права делать самостоятельный вывод, что говорящий имел ввиду.
Тут надо объявить бойкот американской компании Гугл переводящей на американский английский как нравится американцам. Однозначно. Ну и заодно английскому. И написать жалобу в ООН. Ну а если не отзовутся то в спортлото на хабр
Про дословно вообще речи не было. Речь про неискажение смысла.
Переводчик должен работать так, как будто бы у него кроме толкового словаря и сборника фразеологизмов больше ничего нет, оставляя свою личность за кадром.
Например, «Das Leben ist keine Einbahnstrasse» переводится с немецкого не как «жизнь — не улица с односторонним движением», а «жизнь бывает трудна»
Первый вариант немного режет слух в русском языке, но он все равно правильный и означает «сделанного не вернешь». Ваш вараинт искажает немного смысл в пользу нормального (для русских) звучания (кстати, спорно, мне вполне нравится, если заменить «улица» на «дорога»), но все еще сохраняет смысл, в целом. В обсуждаемом же примере смысл полностью меняется.
В обсуждаемом же примере смысл полностью меняется.

Дак то не мне нужно доказывать… и я ничего другого в статье и не написал.

На самом деле — нет, даже если нет контекста, предложение редко можно перевести дословно…
Например, «Das Leben ist keine Einbahnstrasse» переводится с немецкого не как «жизнь — не улица с односторонним движением», а «жизнь бывает трудна» и т.п.

Ну мы же чаще используем не пословицы и поговорки с философским наполнением, как в вашем примере, а вполне нормальные предложения, бытовую лексику и однозначные предложения/словосочетания. Первые иногда без особенностей знания культуры, истории и жизни носителей и не объяснишь.
бытовую лексику
Бытовая лексика просто-таки переполненна «поговорками», «иговорками' и всяко-разно жаргонизмами. Ни о каких „однозначных предложениях“ речи нет даже близко.
Бытовая лексика просто-таки переполненна «поговорками», «иговорками' и всяко-разно жаргонизмами.

Жаргонизмы это немного не сюда. Я разговор механиков не всегда пойму, но это и не бытовой разговор.
А так мои коллеги и знакомые, например, не используют пословицы и поговорки в общении. И мы не общаемся о работе в это время.
А так мои коллеги и знакомые, например, не используют пословицы и поговорки в общении.
Советую вам записать разговор ваших знакомых, а потом посчитать количество мест, где слова были употреблены «не кананично» и где переводить их дословно нельзя.

Будете удивлены.
Мне и так нужно переводить, я с коллегами на немецком общаюсь. Потому уверен, что пословиц нет. И нет, они не адаптируют язык под меня (на случай возникновения такого вопроса).
UFO just landed and posted this here
Наверно постольку у некоторых, мигрировавших за лужу, мозг отключается напрочь, и они начинают огульно верить тому что им «правдивая» американская газета расскажет… Или сразу так в школе преподают?
А по теме контекста — он то как раз у обеих фраз один… Только перевод, внезапно, разный…
Но кому-то видимо всё то — Божья роса…
Достаточно развёрнуто, небрат?
UFO just landed and posted this here
Ну-ну… А кто сказал, что действие происходит в наше время, а небрат? А вдруг я исторический трактат перевожу? И Россия в этом случае много-много раньше США чего-то там наприсоединяла?
Как тут с логикой-то?.. Догадывается он, ага…
UFO just landed and posted this here
Объясняю для дятлов для тех кто в танке.
Россия присоединила Крым в 1783 году.

Ещё вопросы есть?
UFO just landed and posted this here
Искажается эмоциональный окрас фразы.
UFO just landed and posted this here

Ну вот как с такими разговаривать…
Кто мне двумя комментариями выше про "нет ООН", "когда было" и т.п. распинался...


т.к. в 1783 тоже была аннексия.

Иии?.. Вывод-то какой? Т.е. в 1845 уже нет по видимому? А потом снова…
Ну-ну. (Интересно почему именно мне здесь некоторые про двойные стандарты рассказывают).

UFO just landed and posted this here
Тут все сложнее. Слово «annexed» появляется при использовании слова «Крым», но только в сочетании с некоторыми странами. При этом с США и Россией появляется, с некоторыми — нет.
Россия присоединила Литву — Russia joined Lithuania
Россия присоединила Крым — Russia annexed the Crimea
США присоединила Крым — The United States annexed Crimea
Украина присоединила Крым — Ukraine joined the Crimea
Вова присоединил Крым к связи — Vova joined the Crimea to the connection
Вова и Дима присоединили Крым к связи — Vova and Dima annexed the Crimea to the connection
Вова и Дима присоединили Крым к конференции — Vova and Dima joined the Crimea to the conference
В общем, человеческой логике не подчиняется в каком случае «annexed», а в каком «joined».
разница в «присоединить территорию А к стране Б» и «присоединить какой-то В к какому-то Г»
Нет, я специально привел примеры. Как с применением имен собственных, так и названий стран возможен и такой и такой варианты. Более того, влияют и добавочные слова. «присоединил к связи» будет «annexed», а «присоединил к конференции» будет «joined».
С первого взгляда, простой логики, объясняющей применение «annexed» или «joined» — нет. Объединяет все варианты только слово «Крым».
для разнообразия можете попробовать «США присоединили территорию Техаса» — и будет тоже annexed (у которого тоже есть много своих смыслов кроме «присоединение территории»)
Да тут даже далеко ходить не надо.

Вова и Дима присоединили Крым — будет «Vova and Dima annexed the Crimea», но если
заменить Диму на условного Сережу, то будет все лояльнее — «Vova and Sergei joined the Crimea». Причем, заметьте, гугл прекрасно понимает имена собственные — он заменил Сережа на Sergei.

Справедливости ради, если поиграться именами, то начинается рандом.
Мне кажется, гуглопереводчик научился такому переводу по новостям. Он же давно уже стал показывать примеры употребления переводимого в новостях.

США присоединила территорию техаса
США присоединила территорию Техаса
США присоединили территорию техаса
США присоединили территорию Техаса


— результат
The United States joined the territory of Texas
The United States annexed the territory of Texas
The United States annexed the territory of Texas
The United States annexed the territory of Texas

The United States joined the territory of Texas
The United States annexed the territory of Texas
The United States annexed the territory of Texas\


— результат
Соединенные Штаты присоединились к территории Техаса
Соединенные Штаты присоединили территорию Техаса
Соединенные Штаты аннексировали территорию Техаса \

Несколько лет назад пытался перевести гулом текст с китайского на русский — мало что понял. Но на английский перевелось очень даже хорошо. Это заметка про One Shot, возможно уже что-то поменялось. А по поводу epic fail — переводит лучше чем некоторые профессиональные переводчики. Но если кто подскажет переводчик получше (и ещё бы оффлайновый)- буду благодарен.
Сам-себе отвечу. Наткнулся на статью, которая подтверждает мои слова, за что минус — не понятно.
Блеск и нищета электронных переводчиков.

Гугл транслейт не может мне перевести «Императорский аэрокосмический концерн» на немецкий.

Зато может на монгольский. Это звучит мощно!

Эзэн хааны сансар огторгуй анхаарал хандуулах

Но это не то, что мне нужно.
Der keiserliche Luft- und Raumfahrt-Konzern…
Это не гугль, это как было бы правильно.
В чем нельзя упрекнуть автоматические системы — словарь они хотя бы использовать умеют (что в Мозилле, что в Гугле).
Kaiser через «а» пишется. А дефис в Raumfahrtkonzern лишний.
Kaiser через «а» пишется

(посыпая голову пеплом) писал с мобилы, ночью… полузасыпая...


А дефис в Raumfahrtkonzern лишний.

Он мог бы быть действительно лишним, если бы не а не перечисление ("Luft-", который относится к "fahrt") до этого, и если уже речь зашла за duden, то почитайте про worttrennung на досуге...


Писать "Raumfahrt-Konzern" точно так же правильно как и "Raumfahrtkonzern", а иногда не только "так же", но и единственно верно.

Worttrennung — это больше к переносам. Если пишется несколько слов с одинаковыми корнями, то последнее не отделяется. Тот же «Luft- und Raumfahrtkonzern» в немецкоязычной части Википедии пишется без дефиса во втором слове (даже в названиях статей). Пример попроще — «вход и выход» пишется только «Ein- und Ausgang» и ни в коему случае не «Ein- und Aus-Gang».
«Ein- und Ausgang» и ни в коему случае не «Ein- und Aus-Gang».

Иии? Поэтому же "Luft- und Raumfahrt" написано так а не "Luft- und Raum-Fahrt" (хотя я и например даже "Luft- und Raum-Fahrt-Programm" редко но встречал).


Вы не поняли мой посыл, "Luft-" в той же мере относится к "Raumfahrt", как и "Ein-" к "Ausgang"...

Понял я ваш посыл. Ни разу в деловой переписке я не видел, чтобы кто-то в последнем слове, которое пишется слитно, писал через дефис. Даже если слово составное из трех слов, вроде Gleich- und Wechselstrombahn, такое обозначение используется во всех стандартах Дойчебан, а не Gleich- und Wechselstrom-Bahn.
я и например даже «Luft- und Raum-Fahrt-Programm» редко но встречал

Бывают как ошибки, так и просто недосмотр. Или вариант «легкого языка» для тех, кто не владеет немецким в полной мере. В стандартах тоже бывают опечатки и несогласованные предложения (даже бессмыслица полная в одном случае).

А т.е. вы из тех, кто вещи типа "RkReÜAÜG" без дефисов одним словом пишет… (я про "Rinderkennzeichnungs- und Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz").
Или такие "Grundstücksverkehrsgenehmigungszuständigkeitsübertragungsverordnung"...


Бывают как ошибки, так и просто недосмотр.

Ну-ну. Ерунду не надо нести, ладно...


Например "Kraftfahrzeughaftpflichtversicherung" — в корне неверно.
Правильно "Kraftfahrzeug-Haftpflichtversicherung".


Или вариант «легкого языка» для тех, кто не владеет немецким в полной мере.

Тут вы мимо, ибо я уже лет 20-ть с гаком на немецком и пишу (и к слову даже говорю без акцента), и например тот же мой двадцатилетний оболтус (граммар-наци к слову), родившийся и закончивший в Германии Abitur, еще ни разу меня не поймал на "так низя" (причем ему очень того бы хотелось)...

А т.е. вы из тех, кто вещи типа «RkReÜAÜG» без дефисов одним словом пишет… (я про «Rinderkennzeichnungs- und Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz»).

Не нужно доводить до абсурда. Есть по сути общая лексика, а есть предусмотренное законом написание слова, как ваш пример со страхованием ответственности.
Ерунду не надо нести, ладно...

Что, вы никогда ошибок в немецких документах не видели? Причем не простых, а вроде тех же DIN VDE, после того, как они стали переводиться с английского в целях гармонизации.
А вот… как раз вполне логичный пример с точки зрения того КАК работает гуглопереводчик.
Как бы и не скрывалось что с самого начала используются не правила перевод а статистика двуязычных текстов (ну а сейчас — нейронки). Получаем отражение реальности, как система ее видит.
Отсюда и все истории с переводом Путина как Obama или там «Революція гідності» как «политический кризис на Украине» или Російська Федерація как Мордор.
И кнопочка «предложить исправление» там в том числе и для исправления таких вот сюрпризов.
Если кого обвинять — так скорее тех людей (и прессу) кто на английском преимущественно пишет про аннексию Крыма а на русском — преимущественно про присоединение Крыма.

Уж лучше так чем полный бред в качестве перевода. Да, надо держать в уме такие вот особенности… но про Крым — все, кого качество перевода предложений с его участием — волнует, и так в курсе всех точек зрения данный вопрос.

Если мне придется текст на китайском читать где упомянуты события на площади Тяньаньмэнь — как бы я не из переведенного текста буду решать ЧЕМ эти события были (у Китая и Запада на этот счет — разные версии) но с учетом что я не знаю китайского вообще — этот текст даст хоть какие то детали. Пусть политически окрашенные.
А в чём проблема то?

Нейросетевые модели машинного перевода по сути дела — наврорченные языковые модели, которые имеют ещё и некоторый вход и сильно обусловлены им. Гугл, насколько я знаю, собирает свой корпус для обучения моделей полу-автоматически из интернет текстов. Так как английские новости в основном используют слово annex в отношении Крыма и действий России с ним, то языковая модель выберет этот вариант. То же самое про Штаты и Техас. С именами уже сложнее, так как я думаю что такой комбинации слов в примерах для обучения гораздо меньше, поэтому всё начинает плавать при замене одного слова на другое.
Занимаюсь переводом документации и математических текстов… с автором абсолютно согласен. Переводчики от гугла и яндекса как-то не особо помогают с переводом, а побуждают учить язык самостоятельно.
Sign up to leave a comment.

Articles