Комментарии 33
Хотелось бы найти то письмо на немецком (4 абзаца), который мне дали на перевод на русский, так сказать по-быстрому (ага, прогони через гугл транслейт), чтоб понимать, что они в целом хотят. Не нужно красиво, просто смысл… ибо никто не знает, а в школе ты же учил. Был это 2011-й год. Сказать, что это был плохой перевод — ничего не скажешь. Если там был nicht — переводчик лепил это «не» куда угодно, приставки, которые были в конце — почти не учитывал, неправильные глаголы не корректно воспринимал, мог вообще другое слово вставить. Я не мог понять даже сути. Пришлось каждое слово отдельно с несколькими словарями переводить, потом строить словосочетания, смысл до запятой, а потом вникать в самое предложение (там 1 предложение в 4 строчки!!). Даже попытка переводить на английский, а потом с английского на русский (это уже без гугла делалось) — не сильно помогала, но в целом хотя бы примерно суть самого предложения читалась. Возможно то, что немцы пошутили и создали такой текст, но тогда гугл не катил, даже просто чтоб хоть как-то понять. После этого мне не приходилось переводить с немецкого. Сложно теперь сравнить.
>No one reflecting on their life has ever wished there had been fewer such moments.
>Google: Никто, размышляющий о своей жизни, никогда не мечтал, что таких моментов было меньше.
>Human: Оглядываясь на прожитую жизнь, никто не скажет, что таких моментов было слишком много.
Разве тут смысл не в том, что: «никто не хотел бы, чтобы самоанализа в жизни было поменьше»? ИМХО, машинный перевод ближе вашего human…

>Является ли человек жестоким зверем под тонким слоем цивилизации
Не обижайтесь, но и здесь ваш human звучит как дословный машинный перевод (но уже какой-то другой фразы). Гораздо благозвучнее было-бы так: «Возможно, цивилизация — всего лишь тонкая оболочка над воплощением зла?», или «Цивилизация — тонкое покрывало архаичных убеждений?». Как то так…
Разве тут смысл не в том, что: «никто не хотел бы, чтобы самоанализа в жизни было поменьше»?

Ээээ, нет?

Ну, без контекста, как дано в примере, «such moments» — это именно моменты самой рефлексии, а не нечто, о чем думается во время рефлексии.

Это зависит от того, как вы читаете фразу. Я, например, не отнес such moments к рефлексии (еще и потому, что сама фраза противоречит моему здравому смыслу тогда).

А в чем противоречие? Люди рефлексируют время от времени. Любой, кому знакомо это состояние, хотел бы его повторения вновь и вновь. Люди любят рефлексировать. Никто бы не желал отказаться от этого состояния, не хотел бы рефлексировать меньше.
Любой, кому знакомо это состояние, хотел бы его повторения вновь и вновь. Люди любят рефлексировать.

Нет. Я не люблю рефлексировать.

Нет, автор цитаты этого не утверждает. Это вы прочитали в этом предложении; я же, имея другие предпосылки, прочитал другое.

в нашей речи всегда есть фразы или не имеющие точного смысла или имеющие несколько смыслов (в зависимости от настроения или интонации говорящего).
эти фразы включаются, как правило намеренно, для украшения рассказа или передачи настроения и смысла для общего контекста не несут, не говоря уже о точном соответствии речи говорящего его мыслительным образам (Поймет ли он чем ты живешь, Мысль изреченная есть ложь).
не удивлюсь если в общем контексте речь идет про колбасу…
Спасибо за статью. Использование в статье на такую тему выражения «сломанный телефон» вместо «испорченный» — это явный масонский знак, но, не являясь масоном, я имею наглость просить о расшифровке его смысла и\или более конкретных адресатов.
No one reflecting on their life has ever wished there had been fewer such moments.
Google: Никто, размышляющий о своей жизни, никогда не мечтал, что таких моментов было меньше.
Human: Оглядываясь на прожитую жизнь, никто не скажет, что таких моментов было слишком много.

В голове я перевел точно также как Google. Мне кажется в вашем человеческом варианте многовато отсебятины. И вообще, плохой пример, потому что без контекста его смысл непонятен.

Да я б сказал, что там и смысл совершенно иной. " has ever wished " как бы про желание, а не про чесание языком. Правда почему гугл решил это мечтой назвать. Как-то непривычно романтично для робота
вы считаете, что google translate умеет с контекстом работать?
К примеру если набрать фразы:
«Он живет в Москве. Работает там же.»
Он даже местоимение не подставит вопреки грамматике…
Может конечно это слишком простая для него проверка и нужны сложные литературные тексты…
Это я к тому, что в статье сравниваются переводы без контекста и все одинаковых условиях
Не совсем по теме, но вопрос о наболевшем из личного опыта: частенько приходится пользоваться немецкими сайтами/форумами (возможно, кто-то ещё не знает, но если вставить в окно ссылку вместо текста — переводится весь сайт целиком, чем я и пользуюсь в постоянном режиме). Немецкий не понимаю вообще, с английским получше. Так вот качество перевода с немецкого на английский на сегодняшний день — прям «4+», иногда такое ощущение, словно на англоязычном сайте/форуме, настолько приятный перевод с немецкого. Но при этом если поменять язык-назначение с английского на русский — читать невозможно. С чем такое связано?
Уж не знаю, откуда берутся выводы, что качество за 2017 сильно выросло. Может быть, на чем-то и выросло. Но проблема в том, что это качество абсолютно непредсказуемо.

Я регулярно провожу свои тесты, и их результаты не меняются уже много лет. Тесты просты до безобразия — берется первая попавшаяся техническая книга, что-нибудь о программировании, например про какой-то opensource продукт от Apache, в общем, что-то такое, что нужно вот сегодня прочитать. Берем пару страниц, засовываем в google translate, смотрим результат перевода на русский.

Результат стабильно помоечного качества, читать его невозможно, при этом как русский язык (согласование слов в предложениях, например), так и смысл оставляют желать много лучшего.

Что при этом мне кажется еще более важным:
— у софта нет никаких органов управления, которые можно было бы покрутить, чтобы скажем тривиально сообщить программе, что вот это технический текст, и нужно предпочесть вот такой словарь
— наплевать, что оно где-то там внутри самообучается, потому что я его обучать не могу
— нет никакой обратной связи. Даже самый плохой переводчик человек вполне может сказать что-то вроде: «Знаете, я этот текст совершенно не понял, потому что ..., поэтому качество перевода — так себе». От google translate вы этого не дождетесь.

Ну то есть, с моей точки зрения мы имеем софт, который претендует быть шибко умным, но при этом иногда дает заведомо отвратительные результаты. Спрашиваем себя — можем ли мы доверять этому софту, если нужно перевести что-то, в чем мы не разбираемся, скажем, юридический или медицинский текст? И ответ стабильно отрицательный — нет, не можем. Этому можно доверить только текст на знакомую тему, который потом вычитает человек.
Обратная связь там есть. Можно предложить правильный перевод. Более того, там реальные люди проверяют перевод, хотя судя по всему как раз из-за некоторых людей перевод неправильный.
Так проблема в том что «общий» правильный перевод — один и по умолчанию надо использовать его, но вот в этом конкретном тексте определенной тематике (неважно компьютерной, медицинской или нефтепереработка) данная фраза переводится по другому. И не как нельзя указать что этот текст относится к данной тематике.
Я до сих пор уже много лет помню, как когда-то в ФИДО несколько человек доказывали одному «переводчику», что для перевода нужно знать лексику по предмету. Не смогли убедить в том, что для баксетбола термин pivot переводится как пивот, потому что это баскетбольный слэнг. А тут и указать никак нельзя.
для баксетбола термин pivot переводится как пивот,
что это значит?
Ну, вот же статья: en.wikipedia.org/wiki/Pivot — и что характерно, вы легко можете оценить, сколько там у него значений. Причем:

— Pivot or center (basketball), a player position in basketball
— Pivot turn (skiing), a technique of turning in place in skiing

я имел в виду второе, про которое тут написано, что это skiing. Но на самом деле в баскетболе такой же разворот (технику разворота) тоже в русской баскетбольной терминологии называют пивот.
Честно сказать, для меня просто открытие. Что у нас, что в НБА — пивот, даже и не слышал.
Там ссылка в гугле пивот означает Центр, а не обманное круговое движение. И более того В НБА говорят спинмув, пивот фут — опорная нога. Просто пивот — перевод как разворот, пивот мув — обманное круговое движение. Пивот — это жалкая калька с английского, при этом когда говоришь пивот мув, то тебя все начинают уважать на площадке, особенно во дворе. Это всё равно что говорить, что Гуд Бай и Хелло — это слэнг и он не переводится.
На самом деле, речь же не об отдельном термине. Вы можете называть это как угодно — но в любом случае, существует профессиональная терминология. И для перевода любого текста, хотя бы чуть-чуть специального, нужно применять ее. И в случае с google translate претензия к нему состоит в том, что подсунуть ему свой словарь никак нельзя, а с определением тематики из контекста у ИИ пока большие проблемы.
Посыл понятный, просто этот пивот. Travelling — это пробежка, а не путешествие или путешествующий ,double dribble — двойное ведение, а не двойной дриблинг, slam dunk — это забить сверху мяч, а не какое-то шлепанье. Но пивот меня просто ввел в ступор. Пивот фут — это опорная нога, но никак не крутящаяся или же пивот нога — но это я уже повторяюсь. Пивот. Столько играть в баскетбол и столько просмотренных матчей НБА с американскими комментаторами… что прям аж ступор наступил…

Вы просто слишком высоко сразу задрали планку. Паренёк растет, становится сильнее, прыгает выше. Но всё ниже установленной вами планки. И вы не видите результата.

Вот смотрите, для намного более простых сервисов, что-то типа геокодирования от google карт, мы на выходе имеем показатель качества.

А тут сложный процесс, и никто не сомневается в этом. И при этом никакого показателя качества нет вообще. Мы вызвали сервис, он дал нам на выходе перевод, и это все. Вы когда-нибудь видели, чтобы google translate ответил «ну не шмогла я»? Я — нет.

То есть, я знаю, что этот процесс может наврать с переводом в любой момент, но узнать об этом нельзя.

Ну да, моя планка может и высокая, но вполне осмысленная — этот продукт не пригоден к промышленному применению. Не был таким в 2001, и не пригоден сейчас. В этом смысле его качество не изменилось.
Можно задонатить время машине и попроверять переводы с языка на язык. Правда гарантировать, что фразы будут по техническим областям никак нельзя.
Было бы интересно узнать, что приводит вот к таким аномалиям перевода:
translate.google.ru/#auto/en/eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee%20eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee
Это «нейросеть» приходит к таким вариантам перевода? Если да, то как?
На вход подается список лексем как сигнал, который обрабатывается на внутренних слоях и пытается по весам выдать хоть какое-то осмысленное предложение.
Нейронный машинный перевод литературных текстов? Гуглу бы сначала со словарями разобраться чтобы вот таких ляпов не было:
+
image

:)
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.