Pull to refresh

Comments 94

Хм документацию и правда хорошо переводит. Если бы не определённая особенность, что в документации часть слов это команды или обозначения, а не часть предложения, то я бы сказал почти идеально.
Хорошо? Я вот засунул, как обычно, первый попавшийся фрагмент из первой попавшейся книги (машинное обучение в Spark, что самое смешное) — и на выходе получил вполне обычный для известных уже систем треш.
В основе машинного обучения лежат алгоритмы, которые преобразуют необработанные данные в информацию в боевую разведку. Этот факт делает машинное обучение хорошо подходящим для прогностическая аналитика больших данных. Таким образом, без машинного обучения это было бы почти невозможно полностью поспевать за этими массивными потоками информации. Искра, то есть относительно новая и новейшая технология, предоставляет крупным инженерам и ученым в области обработки данных
мощный отклик и унифицированный двигатель, который одновременно быстрее и проще в использовании.

Переведено с помощью www.DeepL.com/Translator (бесплатная версия)


Не знаю как вам, а я такое просто не могу читать. Для прогностическая аналитика? А слова Пушкин в предложении согласовывать будет? «относительно новая и новейшая технология» — масло масляное, прелестно… А слово Spark, кстати, переводить не просили, это название.

«крупным инженерам и ученым в области обработки данных» — угадайте с трех раз, кто был в оригинале?

Ну в общем, вывод все тот же — как был треш, так и остался.
А слова Пушкин в предложении согласовывать будет?

Редактор. Перевод и локализация — понятия разные.


Кстати ради интереса тоже вбил рандомный текст. Из Game Engine Architecture, хотя не важно. При этом при копипасте пробелы не все остались. DeepL справился, а Google Translate в этих местах дичь выдал. Мелочь, но приятно.

>Редактор.
А нахрена тогда тут переводчик, если все равно нужен человек, и при этом переводчику этому он верить не может совсем, потому что машина гонит пургу?

Биологическому переводчику тоже редактор нужен.

Дело в том, что я был редактором. И как-то, было дело, отредактировал десятки тысяч страниц переводов. Поэтому могу уверенно сказать, что мне, как редактору, вот такой переводчик нафиг не сдался. Именно по той причине, что я не могу верить этому подстрочнику.

Человек выгодно отличается от вот этого тем, что умеет задавать вопросы. То есть, даже если он переводит плохо — он как правило знает, что вот этот текст он не понял. И в его переводе будут пометки об этом, о конкретных терминах и т.п.

Если мы заранее договоримся, то редактируя текст от человека, я могу не читать весь оригинал. Тут же я вынужден буду перепроверять все целиком, от и до.

Так в чем тогда профит от такого ИИ переводчика?
Да, кстати, неплохо было бы, если бы е-толмач мог пометить фрагмент с неточным переводом. Но в целом прогресс в этой области очень заметен.
Знаете, я думаю что водораздел между теми, кто смотрит на успехи ИИ в этой области с энтузиазмом, и теми кто скептически, вроде меня, он проходит где-то по линии «для чего мы это используем». Т.е., если нам переводчик нужен «для себя», чтобы понять смысл текста, и мы язык знаем недостаточно — то да, прогресс очевидно налицо, и наверное пользоваться можно. Если же переводы это работа, если тексты сложные, и язык мы знаем достаточно хорошо, то текущее качество перевода пока скорее низкое.

И даже не столько низкое — иногда оно вполне приемлемое, сколько непредсказуемое. Скажем, если бы меня попросили перевести Бармаглота, я бы просто ответил: «Сорян, это стихи, и это игры с языком, я на такое не способен». А тут машина нам не смущаясь пишет: «Клинок ворпала хихикнул-закуска!», и хоть бы хны :)
Молодец DeepL, хорошо сказал, красиво!
Вообще-то это Яндекс был, не? Но да, правда смешно.
А слово Spark, кстати, переводить не просили, это название.

Вот это как раз пока сложно для машинных переводчиков (да иногда и для немашинных) — определить, что название, а что нет (конечно, в тех случаях, когда названия — это "простые" слова типа Windows или Office). Тем более, конкретно в этом предложении слово Spark стоит в начале, поэтому нельзя определить имя собственное по тому признаку, что оно пишется с заглавной буквы.

Естественно. Дело даже не в названиях — у ИИ нет контекста в широком смысле. Вон, ниже был пример, где в одном переводе обед, а в другом, тоже самое — уже стало ужином.
Зато очень веским намёком на то, что Spark — имя собственное, почти что гарантией этого служит отсутствие артикля.

С другой стороны, нет такого правила, что названия не надо переводить. Иногда надо, часто не надо, а часто надо транскрибировать.
Если имя или фамилия — то 100% транскрибируем, либо по правилам, либо используя устоявшуюся транскрипцию.

Засунул кусок статьи. Результат похож на текст на русском языке, а не на "моя твоя не понимать" (куда более связанный и согласованный, чем у гугла), но с технической точки зрения — смех и слезы.


Оригинал

A Quad Copter is a four-rotor helicopter. It is an under-actuated, dynamic vehicle with four input forces (one for each rotor) and six degrees of freedom (6DOF). Unlike regular helicopters that have variable pitch angle rotors, a quad copter has four fixed-pitch and fixed-angle rotors. The motion of a Quad copter in 6DOF is controlled by varying the rpm of the four rotors individually, thereby changing the lift & rotational forces. Quad copter tilts toward the direction of slow spinning motor, which enables it to roll and pitch. Roll and pitch angles divides the thrust into two directions due to which linear motion is achieved. The rotors rotate in clockwise-anticlockwise pairs, (figure1) to control the yaw produced due to the drag force on propellers.The center of gravity (CG) lies almost at the same plane which contains all the rotors. Also all four motors of same class differ in efficiency with each other.


Перевод

Четырехвинтовой коптер — это четырехвинтовой вертолет. Это малоподвижный, динамичный автомобиль с четырьмя входными силами (по одному на каждый ротор) и шестью степенями свободы (6DOF). В отличие от обычных вертолетов, которые имеют роторы с переменным углом наклона, четырехроторный вертолет имеет четыре ротора с фиксированным шагом и фиксированным углом наклона. Движение квадрицептера в 6DOF контролируется изменением числа оборотов четырех роторов по отдельности, тем самым изменяя подъемные и вращательные усилия. Quad-копптер наклоняется в направлении медленного вращения двигателя, что позволяет ему катиться и менять шаг. Углы вращения и тангажа делят тягу на два направления, благодаря чему достигается линейное движение. Роторы вращаются парами по часовой стрелке и против часовой стрелки (рис. 1) для управления рысканием, возникающим под действием силы сопротивления на гребные винты. Центр тяжести (ЦГ) лежит почти в той же плоскости, в которой находятся все роторы. Кроме того, все четыре двигателя одного класса отличаются друг от друга по эффективности.


Перевод Google Translate

Quad Copter — это вертолет с четырьмя винтами. Это динамическое транспортное средство с недостаточным приводом и четырьмя входными силами (по одному на каждый ротор) и шестью степенями свободы (6DOF). В отличие от обычных вертолетов, которые имеют роторы с переменным углом наклона, четырехъядерный вертолет имеет четыре ротора с фиксированным углом и фиксированным углом. Движение Quad Copter в 6DOF контролируется путем изменения оборотов четырех роторов по отдельности, тем самым изменяя силы подъема и вращения. Квадратный коптер наклоняется в направлении медленно вращающегося двигателя, что позволяет ему вращаться и наклоняться. Углы крена и тангажа делят тягу на два направления, благодаря которым достигается линейное движение. Роторы вращаются парами по часовой стрелке и против часовой стрелки (рис. 1), чтобы контролировать рыскание, создаваемое силой тяги на винтах. Центр тяжести (CG) находится почти в одной плоскости, которая содержит все роторы. Также все четыре мотора одного класса отличаются друг от друга по эффективности.


  • under-actuaded (как я понимаю, термин из ТАУ) — малоподвижный
  • vechicle — автомобиль
  • quad copter — то четырехроторный вертолет, то Quad-копптер
  • pitch angle rotors — вроде бы, о пропеллерах говорят "угол атаки", а не "угол наклона"
  • propellers — грибные винты (что?!)

В итоге, есть как маленькие придирки, вроде угла наклона, так и крупная ошибка, кардинально меняющая смысл (underactuated). Что без контекста и знания предметной области не перевести нормально. В общем, вывод как всегда. Переводчики — помощники, но слепо полагаться на них нельзя.

>вращательные усилия
Скорее всего — моменты.

>позволяет ему катиться и менять шаг
А это что вообще было?

Насчет pitch angle — не факт что тут про угол атаки.

>с технической точки зрения — смех и слезы.
Согласен, но это — сложный текст. Тут нужен специалист, иначе у человека тоже получается та еще хрень.

Про pitch angle rotors это, вроде, именно "с переменным углом наклона", там ось вращения наклоняется, за счёт чего происходит движение в нужном направлении, угол атаки это вроде как уже у всего вертолёта при движении. А вот шаг это как раз про наклон лопастей https://yandex.ru/turbo?text=https%3A%2F%2Fru.wikipedia.org%2Fwiki%2F%25D0%25A8%25D0%25B0%25D0%25B3_%25D0%25B2%25D0%25B8%25D0%25BD%25D1%2582%25D0%25B0
p.s. возможно я ошибаюсь в терминах.

Ошибаетесь. У лопасти вертолётного винта непрерывно меняют угол атаки. Когда лопасть идёт вперёд — угол атаки меньше, когда назад — больше. При этом для сохранения постоянства оборотов при увеличении мощности двигателя увеличивают и общий для всех лопастей угол атаки.
У квадрокоптера (обычно) лопасти фиксированы, тяга меняется скоростью вращения винта. Угол атаки каждой лопасти постоянен вне зависимости от приводимой к винту мощности или направления движения лопасти вперёд/назад.

Да вы правы, в современных вертолётах, но в оригинале "variable pitch angle rotors" скорее бы перевёл как "с регулируем шагом" (хдинамических) т.к. в след предложение содержит разделение на шаг(вроде как у нас принято такое названия вместо "угол установки лопастей") и наклон, с помощью наклона это, насколько я понимаю, более старый способ движения вперёд...

Наклона винта у вертолетов не бывает, для движения вперед наклоняется вся машина за счет изменения циклического шага винта. Подъемная сила задней половины винта делается больше, и весь вертолет наклоняется.


В тексте явное упоминание общего и циклического шага винта. Но надо делать скидку на то, что оргинал писал журналист. Как сумел, так и написал :-)

>Наклона винта у вертолетов не бывает
Так это у вертолетов. У мультикоптеров и разных гибридов вполне себе бывают винты поворачивающиеся целиком.
Давайте оставаться в теме — речь в обсуждаемом тексте и, соответственно, в обсуждении, идёт именно о вертолётах vs квадрокоптеры. Причём в тексте речь именно о простых (малых) квадрокоптерах без автомата перекоса и иных изысков.

А так-то про V-22 и другие аппараты с поворотными винтами могу порассказать тоже.
Речь в обсуждаемом тексте вообще про ИИ и машинный перевод :)

И применительно к квадрикам я бы сказал так — современный ИИ не в состоянии понять, что речь «простых (малых) квадрокоптерах». Я даже про себя сказал бы, что мне это не вполне очевидно. Откуда такой вывод, кстати, он из этого одного абзаца?

Соответственно, поскольку у ИИ нет контекста, он не может решить, бывают ли на самом деле поворотные винты, или нет, и как их лучше называть в каждом конкретном случае. Вряд ли ИИ в данном случае вообще коптеры от вертолетов всегда отличит.
Не передёргивайте, конечно же, вопрос о вертолётах — в рамках данной ветки. И, как выяснилось, большинство принявших участие в обсуждении человеков тоже не способно однозначно и правильно перевести. Ну, не их это тема. Потому вряд ли ИИ стоит так уж осуждать.
>Не передёргивайте
Там эта, смайл стоит, вообще-то.

>Потому вряд ли ИИ стоит так уж осуждать.
Ну, собственно у меня лично претензия одна — в отличие от человека ИИ все еще не может сказать: «Не, я не специалист, позовите тех, кто в теме». И это должна быть базовая функция, а не опция.
в отличие от человека ИИ все еще не может сказать: «Не, я не специалист, позовите тех, кто в теме».
И сколько человек из обсуждавших сказали: «я не в теме» и перестали пытаться перевести? Ото ж.
Ну, я так делаю всегда — если это перевод за деньги (ну и при некоторых очевидных условиях, типа наличия тех людей, у которых вообще можно спросить).

И если бы мы тут реально переводили, а не трепались — первое что я сделал бы, это спросил, о чем собственно текст. Потому что сейчас я вообще не понимаю, зачем тут этот самый термин under-actuated, который в моем понимании реально из ТАУ — значит ли это, что вся статья об этом? И все хорошие переводчики, что я встречал, как правило поступают именно так. Поэтому они и хорошие, кстати.
Он между прочим обучился и улучшил результат

Квадрокоптер - это вертолет с четырьмя роторами. Это динамическое транспортное средство с недостаточным управлением, имеющее четыре входные силы (по одной на каждый ротор) и шесть степеней свободы (6DOF). В отличие от обычных вертолетов, имеющих роторы с переменным углом шага, квадрокоптер имеет четыре ротора с фиксированным шагом и фиксированным углом. Движение квадрокоптера в 6DOF контролируется путем изменения оборотов четырех роторов по отдельности, тем самым изменяя подъемную и вращательную силы. Квадрокоптер наклоняется в сторону медленно вращающегося двигателя, что позволяет ему крениться и тангажироваться. Углы крена и тангажа делят тягу на два направления, благодаря чему достигается линейное движение. Роторы вращаются парами по часовой стрелке против часовой стрелки (рис. 1), чтобы контролировать рыскание, возникающее из-за силы сопротивления пропеллеров. Центр тяжести (ЦТ) лежит почти в одной плоскости, в которой находятся все роторы. Кроме того, все четыре двигателя одного класса отличаются друг от друга по эффективности.

«Тварь бриллигская, и щелевые печи
Появился в вейбе:
Все мимсы были бороговыми,
И крысики-момомомы перестают существовать.

»Остерегайся Бармаглота, сын мой!
Челюсти, которые кусаются, когти, которые ловят!
Остерегайся птицы Jubjub, и избегай
Жестокий Бандерснатч!"

Он взял в руки вихревой меч;
Давным-давно мужественный враг, которого он напугал…
Так отдохнул он у дерева Тамтум.
И задумался.

И, как в уффишской мысли, он стоял,
Бармаглот с огненными глазами,
Пришёл вздрогнуть в тюльгийском лесу,
И сгорел, как только пришел!

Раз, два! Раз, два! И через и через
Лезвие ворпала пошло на хихиканье!
Он оставил его мертвым, и с его головой
Он поехал галумфать обратно.

«И ты убил Джаббервока?
Иди ко мне на руки, мой бревенчатый мальчик!
Слабый день! Каллу! Каллей!»
Он замерз в своей радости.

«Бриллиг, и щелевые печи
Появился в вейбе:
Все мимсы были бороговыми,
И крысики-момомомы перестают существовать.

Переведено с помощью www.DeepL.com/Translator (бесплатная версия)
Ну, в данном случае результат был вполне предсказуем.
надеюсь, в обозримом будущем ИИ не сможет это перевести. иначе нас ждет также неиссякаемый поток ИИ-песен, ИИ-прозы, ИИ-живописи и т.д.
Ой, да какое там… ну вот смотрите, случайная книжка, на этот раз — анимация:

>Прежде чем мы все выйдем и повесимся в отчаянии, позвольте мне посоветовать вам сесть. вниз и смотреть
Как вы думаете, что было на месте «сесть. вниз»? :) И зачем тут точка после «сесть», которой не было в оригинале?

Ну т.е., я пока вижу вот что: этот ИИ лажает. Следовательно, доверять этому переводу, даже как подстрочнику, нельзя. И лажает он как на художественных текстах, типа Джаббервока (на которых и человеку не стыдно), так и на значительно более простых технических.
UFO just landed and posted this here
Не без огрехов и надобности в коррекции, да, но даже художественный текст оно перевеодит заметно лучше того же гугля.
Летом еще по рекомендации Лебедева, кажется, на эту систему наткнулся, потестировал — вроде было хорошо, на уровне того же гугля.
Сейчас тоже зашел, несколько текстов закинул — примерно то же самое.
Удобно, что можно корректировать перевод, кликнув на слово. В остальном прорыва не заметил.

По сравнению с Гуглом это просто космос.
Живу в Германии, пользуюсь каждый день, еще и русский год назад добавили

Кстати, Гугл все переводит через английский. В итоге перевод немецкий-русский получается порой просто ужасным

UFO just landed and posted this here
Есть такое ощущение, что для каких-то языковых пар они то включают прямой перевод, то через английский. Насчет «через английский» это очень хорошо заметно на некоторых словах когда есть несколько вариантов перевода «исх.язык -> англ.язык» и «англ.язык -> рус.язык», но при этом ну просто никак невозможно перевести таким образом «исх.язык -> рус.язык». Конкретных примеров сейчас не припомню, но видел такое не раз.
Почему с яндексом его не сравнили? Яндекс.переводчик давно на голову выше гуглопереводчика особенно в художественном тексте (песнях например).

Потому что у яндекса русский основной, а вот в мире англиканский основной

Вариант от Яндекса показывает, во всяком случае, некоторое знакомство с классическим русским переводом.

Это был бриллиг и скользкие Тувы.
Неужели Гир и гимбл в вабе:
Отрубить ему голову!,
Как мюмзики в мове.

— Берегись Бармаглота, сын мой!
Челюсти, которые кусают, когти, которые ловят!
Остерегайтесь птицы Джубджуб и избегайте
В frumious Брандашмыг!”

Он взял свой ворпальский меч в руку.;
Долгое время manxome врага он искал—
Так отдыхал он у дерева Тумтум
И постоял немного в раздумье.

И, как уффиш думал, он встал.,
Бармаглот с горящими глазами,
Пришел whiffling через Бармаглот древесины,
И бормотал, когда он пришел!

Раз, два! Раз, два! И насквозь, насквозь.
Клинок ворпала хихикнул-закуска!
Он оставил его мертвым и с головой.
Он пошел галопом обратно.

“И ты убил Бармаглота?
Приди в мои объятия, мой мальчик Бимиш!
Сегодня волшебный день! Каллу! Callay!”
Он захихикал от радости.

Это был бриллиг и скользкие Тувы.
Неужели Гир и гимбл в вабе:
Отрубить ему голову!,
Как мюмзики в мове.

Вот только кто бы объяснил, откуда у ИИ такое желание отрубить голову в первой же строфе, когда в оригинале об этом нет и речи:

’Twas brillig, and the slithy toves
Did gyre and gimble in the wabe:
All mimsy were the borogoves,
And the mome raths outgrabe.
>некоторое знакомство с классическим русским переводом.
Ну, сильно лучше-то от этого не стало, не так ли?
я думаю меньшинство людей пользуется переводчиком для перевода стихов, зачем вы второй раз подряд тут приводите такой пример именно со стихами? Со своей основной функцией на большинстве текстов он приемлемо справляется.
Давайте я поясню. Вы можете ответить, где заканчивается то «большинство текстов», с которым этот ИИ на сегодня справляется? А если нет — то представьте, что вам нужно перевести юридический документ с китайского на немецкий — и вы не знаете обоих. Насколько полученный результат вообще применим, если вы не можете его проконтролировать?

Ну т.е. проверка на стихах — это конечно экстремальный тест, который показывает (уже в который раз), что никакого прорыва на самом деле не случилось. Как много лет назад были тексты, которые гугль переводил приемлемо, так и сейчас такие есть. А вот ограничить более четко эту область применимости мы как не могли, так и не можем.
перевести юридический документ
Язык юристов — это вообще настолько вещь в себе, как по особенностям терминологии, так и по возможным последствиям от ошибки, что, по-хорошему, такой перевод должен делать только профессиональный юрист, причем разбирающийся в праве тех стран, с/для которых делается этот перевод.
Нереальный пример. Тоже самое, как перевести из ассемблера RISC в LISP не зная обоих.
Ну вообще я специально преувеличиваю, чтобы было понятнее. Да, если вы не знаете ни языков, ни предмета (будь то юриспруденция, или космонавтика) — вам вряд ли вообще что-то светит.

Суть же в том, что мы не знаем того предела, когда перевод машины перестает быть адекватным, даже если целевой язык русский.
Что значит «справляется»? Если всего несколько узкоспецефичных слов переводит неправильно, то да — справляется. В любом случае этот перевод на голову выше например, чем «Сократ персональный» и др. программы двухтысячных годов. Старый мем:
Сегодня коллега притащил инструкцию к купленному за границей забавному китайскому устройству, явно продвигаемому производителями как революционное приспособление, призванное заменить мышь. Смысл — он не смог его установить на компьютер и попросил меня помочь разобраться. Само устройство — чушь редкостная, но вызвала ввиду своей необычности интерес всего офиса, и мы решили перевести инструкцию с корявого китайско-английского…
Захожу на Translate.Ru. Набираю кусок текста инструкции: «Execute the installer by tray icon and insert ms windows binaries or another os with custom mouse driver support in current boot drive.» Жму «Перевести».
«Казните монтажника изображением подноса и вставьте наборы из двух предметов окон госпожи или другой рот с таможенной поддержкой водителя мыши в текущем двигателе ботинка.»
Тишина. Жалобный Голос коллеги сзади: «Ты сможешь это сделать?..» Весь офис просто лёг.
>Что значит «справляется»? Если всего несколько узкоспецефичных слов переводит неправильно, то да — справляется.

Ну я выше постил пример, когда этот ИИ перевел sit down как «сесть. вниз», вот прямо так, с точкой. Вы считаете, это узкоспецифичные слова?

То есть да, по сравнению с 2000 годами это конечно огромный прогресс, никто не сомневается. Но в тоже самое время оно может спороть внезапно любую чепуху на ровном месте. И в этом смысле — ничего не изменилось вообще.
UFO just landed and posted this here
С русского на английский

Переводчики вслепую выбирали именно переводы DeepL>Blind translators chose to translate DeepL

Слепые переводчики… прорыв однозначно
Переводчики вслепую выбирали именно переводы DeepL => Translators blindly chose translations of DeepL.
Нормально.
Пары английский-русский, русский-английский DeepL переводит чаще гораздо лучше, чем Google.
Давно маюсь, давно сидел на этом берегу, чтобы задать вопрос:
при переводе не «просто копипасты текста», а «текста из инета просто указанием ссылки в окне перевода»
часто натыкался на упорное нежелание и Гугла, и Яндекса, но не Бинга переводить с английского на русский для ссылок на крупнейшие газеты и другие имхо вполне вменяемые ресурсы. Для статей не по подписке, а именно публично доступных, без всяких предварительных регистраций и СМС.
Примера под руками нет — извините, но это случалось у меня много, много, много раз…
Отказ выглядел так: после перемигивания АКА начала перевода страницы и появления русского текста происходило снова перемигивание и мне показывался английский источник.
Для проверки пробовал в том же сеансе переводить совершенно другие произвольные ссылки — они переводились без каких-либо даже намеков на такие проблемы.
Сам вопрос: папа, что это было?
И переводить через Бинг тогда получалось у меня значительно хуже — но уже не помню подробностей, но противнее настолько, что в особо припирающих мое любопытство случаях я копипастил куски интересующего меня текста.
Что еще я забыл рассказать из числа м.б. важных условий?
Например, я принудительно выставлял язык и для источника, и для выхода — но нифига!..
UFO just landed and posted this here
Так и я часто — но нередко и неудача описываемая случалась. Но почему, Холмс?
Есть у меня в закладках любимая статья, которую так никто и не перевел
www.nytimes.com/2018/01/23/magazine/selling-airborne-opulence-to-the-upper-upper-upper-class.html
Вот прямо сейчас Гугл + ФФ52 = тупо и просто полностью пустая страница после мигнувшего появления русского перевода.
Вспомнил еще, что я также щелкаю на кнопки сверху справа «перевод» и «источник» — тоже не влияют в этом случае.
Хромом не пользуюсь, но спасибо за идею, но внизу уже и про него пожаловались.
Эту статью хром переводит корректно.

Но они что-то поменяли в работе расширения. Раньше переводилась вся страница, а теперь только видимые абзацы (при скроллинге на секунду появляется английский текст, потом переводится). Так что может с расширением такой проблемы уже и нет, давненько с ней не сталкивался.
Снова спасибо!
при скроллинге на секунду появляется английский текст, потом переводится
я полный ламер в ХТМЛ, но м.б. это разновидность «ленивой загрузки» или как ее там, как это давно уже сделано у многих, и у Кинопоиска для фото в списке участников фильма, например.
Т.е. такое при переводах у меня давно (но не всегда — м.б. зависит от размера страницы?), и с этим я смирился давно тоже.
Но и это тоже идея, потому что после появления такого эффекта появились и проблемы с отказом в переводе ссылок, а объединяет их именно «перемигивание», только в случае отказа после перемигивания происходит «не то».
Хотя м.б. это «только совпадение», безусловно.
Подтверждаю. Периодически встречаю точно такую проблему.

И кстати, расширение гугла для перевода страниц (т.е. перевод текущей страницы открытой в хроме, а не по ссылке) — точно также иногда отказывается переводить. Замечено, что отказ происходит обычно на одних и тех же страницах, но с чем это связано — непонятно.
Спасибо за хром — мне проще теперь с ним даже не пытаться заморачиваться, а именно некоторые и одни и те же страницы — именно так: сначала пробовал переводить такие через день и через неделю, а потом, если не надоедало и не забывал — уже копипастил кусками.
Вот проверил:
Food is necessary for living, especially when you are young and your body grows up. You wake up, and you are ready for the first meal of the day, it is a breakfast. The healthy breakfast should not burden your body in the morning. The composition of the meal should be based on the natural balance. The first dish for lunch is raw food followed by boiled dishes. The dinner should be as light as it’s possible, because a hearty dinner can disturb night sleeping. Therefore, it should be taken early.

Перевод:
Пища необходима для жизни, особенно когда вы молоды, и ваше тело растает. Вы просыпаетесь и готовитесь к первому приему пищи, это завтрак. Здоровый завтрак не должен нагружать ваше тело с утра. Состав еды должен основываться на естественном балансе. Первое блюдо на обед — это сырая пища, за которой следуют вареные блюда. Ужин должен быть настолько легким, насколько это возможно, потому что обильный ужин может нарушить сон. Кроме того, следует ужинать пораньше.

Перевод от гугла:
Пища необходима для жизни, особенно когда вы молоды и ваше тело растет. Вы просыпаетесь, и вы готовы к первому приему пищи, это завтрак. Здоровый завтрак не должен обременять ваше тело по утрам. Состав блюда должен быть основан на естественном балансе. Первое блюдо на обед — сырая пища, затем вареные блюда. Обед должен быть максимально легким, потому что плотный ужин может нарушить ночной сон. Поэтому это следует принимать рано.

Перевод от deepl:
Пища необходима для жизни, особенно когда вы молоды и ваше тело растет. Ты просыпаешься, и ты готов к первому завтраку. Здоровый завтрак не должен обременять Ваш организм утром. Состав еды должен быть основан на естественном балансе. Первое блюдо на обед — сырая еда, за которой следуют вареные блюда. Ужин должен быть настолько легким, насколько это возможно, потому что сытный ужин может нарушить ночной сон. Поэтому его следует принимать пораньше.
UFO just landed and posted this here
Спасибо за наглядный пример!

Жаль текст довольно простой, фразы короткие и мало связанные друг с другом. По сути, только в последнем предложении упоминается факт из предыдущего, что позволяет судить о том, как переводчик умеет сохранять смысл текста как целого, а не просто переводить знакомые фразы по образцу.

В этом примере deepl использовал правильное слово («его», ужин), что говорит в его пользу. Но делать выводы по одному слову не стоит, это может быть случайностью.

С другой стороны, deepl больше «халтурит» с местоимениями. Вначале обращаясь к читателю на «ты», а потом вдруг перейдя на «Вы» (еще и с большой буквы).

Остальные отличия минимальны и вполне в пределах погрешности.

Так что вопрос не выбора не однозначен.
Да, надо было более сложный текст дать. Вот пример технического текста:

60 GHz Integrated Waveguide Transceivers.

The problem of getting 60 GHz energy on and off the die is not trivial, and special consideration must be given to creating efficient designs that can facilitate easy development at the component level. Since the antennas that are typically used in fully packaged solutions are small and fairly low‐gain with associated wide beam patterns, the resulting operating distance that can be achieved is quite short (on the order of 10m or less). These compact, short range antennas work fine for applications such as indoor wireless links, small radar sensors or even as high‐bandwidth versions of near‐field communications. But many applications require longer range requiring highly directional, larger aperture antennas. High‐gain antennas significantly increase operating range while reducing multipath and interference.


Перевод:
Интегральные волноводные трансиверы диапазона 60 ГГц.

Проблема снятия излучения на частоте 60 ГГц и охлаждения кристалла не является тривиальной, поэтому особое внимание должно быть уделено созданию эффективных конструкций, упрощающих процесс разработки на уровне отдельных компонентов. Антенны, обычно используемые в полностью корпусированных решениях, имеют малые размеры и довольно низкий коэффициент усиления при соответствующей ширине диаграммы направленности, в результате может быть получено лишь небольшое рабочее расстояние (порядка 10м и менее). Подобные компактные антенны с малым радиусом действия нормально работают в таких приложениях, как беспроводная связь в помещениях, небольшие радарные датчики и даже системы связи ближнего поля с высокой пропускной способностью. Но для многих приложений требуется большая дальность, для чего необходимы остронаправленные антенны с большей апертурой. Антенны с большим коэффициентом усиления значительно увеличивают дальность работы при одновременном снижении помех и излучений в боковых лепестках диаграммы направленности.


Перевод от Гугла:

Встроенные волноводные приемопередатчики 60 ГГц.

Проблема получения энергии 60 ГГц на матрице и за ее пределами не является тривиальной, и особое внимание следует уделять созданию эффективных конструкций, которые могут облегчить разработку на уровне компонентов. Поскольку антенны, которые обычно используются в полностью упакованных решениях, имеют небольшой размер и достаточно низкое усиление с соответствующими широкими диаграммами направленности, результирующее рабочее расстояние, которое может быть достигнуто, довольно короткое (порядка 10 м или менее). Эти компактные антенны малого радиуса действия отлично подходят для таких приложений, как беспроводные соединения внутри помещений, небольшие радиолокационные датчики или даже для широкополосных версий систем связи ближнего радиуса действия. Но для многих применений требуется большая дальность действия, требующие антенн с высокой направленностью и большой апертурой. Антенны с высоким коэффициентом усиления значительно увеличивают рабочий диапазон при одновременном снижении многолучевого распространения и помех.


Перевод от DeepL:
60 ГГц Интегрированные волноводные приемопередатчики.

Проблема получения 60 ГГц энергии на матрице и за ее пределами не является тривиальной, и особое внимание должно быть уделено созданию эффективных конструкций, которые могут облегчить разработку на уровне компонентов. Поскольку антенны, которые обычно используются в полностью укомплектованных решениях, имеют небольшие размеры и довольно малый коэффициент усиления с соответствующими широкополосными шаблонами пучка, результирующее рабочее расстояние, которое может быть достигнуто, довольно короткое (порядка 10 м или меньше). Эти компактные антенны малого радиуса действия отлично работают в таких приложениях, как беспроводные линии связи внутри помещений, небольшие радиолокационные датчики или даже в версиях с высокой пропускной способностью в ближнем поле. Но для многих приложений требуется большая дальность действия, требующая высоконаправленных антенн с большой апертурой. Антенны с высоким коэффициентом усиления значительно увеличивают рабочий диапазон при одновременном снижении многопутевых и интерференционных помех.

Текст взят отсюда

Из человеческого перевода куда-то пропал "multipath", но появились "side lobes".

Ну, я просыпаюсь — я готов принимать завраки. Начинаю с первого, а там как пойдет.

The sense of proprioception
The word proprioception comes from two Latin words: proprius, meaning ‘one’s own’, and percepio, meaning ‘to gain, learn, perceive or understand’. It is the sense that informs us of the relative position of parts of the body to each other at any given moment in time. Like the kinaesthetic sense, it is referred to as an internal, or interoceptive, sense, because it is stimulated from within the body itself. This is done via numerous sensory receptors in the internal organs and the inner ear, as well as joint and muscle receptors, all of which are neurologically linked to the brain.

Чувство проприоцепции
Слово проприоцепция происходит от двух латинских слов: проприоцепция, означающая «свой», и перцепция, означающая «приобретать, учиться, воспринимать или понимать». Именно этот смысл информирует нас об относительном положении частей тела друг к другу в любой момент времени. Как и кинестетический смысл, его называют внутренним, или перехватывающим, смыслом, потому что он стимулируется изнутри самого тела. Это происходит через многочисленные сенсорные рецепторы во внутренних органах и во внутреннем ухе, а также через суставные и мышечные рецепторы, которые неврологически связаны с мозгом.

Не понимает контекст терминов (смысл -> ощущение)
Буквальный перевод латинских терминов (интрорецептивный)
Мета-слова (типа do, get,go) не детализированы в контексте и не выражены в литературно принятой форме (This is done via -> Оно возникает благодаря многочисленным )
Машинный перевод — интересная тема, надо будет в ближайшее время что-то почитать по ней (кстати что посоветуете?).
Вообще давно есть такая мысль. Перевод с одного человеческого языка на другой — неконструктивен — именно потому, что человеческие языки неточны и неформальны. А что если разработать специальный формализованный язык (или множество языков — на базе английского, русского и т.д.), на котором можно представлять знания в строгом виде, однозначно понятном для компьютера? Это был бы аналог языка программирования или разметки, с компилятором и «средой разработки», в которых бы проверялась непротиворечивость текста. Тогда перевод такого текста на любой язык фактически был бы достаточно однозначной генерацией (фактически — применением «человеческого» стиля к строго представленному знанию). И заодно исследования в этом направлении открыли бы дорогу к человеческим знаниям для искусственного интеллекта.
Может быть. Только в интеграции со специальным редактором, в котором будет как минимум подсветка синтаксиса, аналог компиляции с выявлением ошибок, элементы гипертекста, построение графов и диаграмм и прочее. Возможно — перевод текста с обычного языка в такую специальную форму.
Английский кстати лучше подходит для такой цели, чем русский, т.к. английский — "аналитический", с неизменяемыми словами.
UFO just landed and posted this here
Как вам например такая идея — вы пишете статью на обычном русском языке, загружаете в некую программу, она проводит семантический анализ и разметку, вы прямо в программе мышкой добавляете семантическую метаинформацию в тех местах, в которых программа вас попросила — и затем одним нажатием кнопки получаете абсолютно качественные переводы вашей статьи на все языки мира?
UFO just landed and posted this here
Чтобы перевод произошел без вмешательства вообще, нужно чтобы возможности компьютера сравнялись с возможностями человеческого мозга, иначе все равно будут ситуации когда компьютер что-то «не поймет» (даже с учетом всяких угадываний по контексту, нейросетей наученных на огромных массивах текстов и т.п.). А это будет еще очень нескоро.

Кроме того, вы рассматриваете только одно применение — перевод с человеческого языка X на человеческий язык Y. То есть изначально рассматриваете что информация предназначена только для человека с его биологическим мозгом — столь же невероятным сколь и несовершенным для решения научно-технических задач. Мне же интересно дать возможность компьютеру самому участвовать в интеллектуальной деятельности, обойдя все несовершенства естественного языка и естественного мышления.

Компьютер мог бы самостоятельно проводить исследования, сбор информации по заданной и смежным темам (при том что я как пользователь просто могу не знать даже названий этих тем), делать выжимки «самого главного» из огромных массивов информации, интерактивно раскрывать непонятные темы в более подробной форме, переформулировать материал в другом стиле (более понятном или удобном для конкретного пользователя), в общем быть таким «расширителем мозга». И всё это требует некой инфраструктуры, которой сейчас просто нет — инфраструктуры унифицированного представления знаний в виде семантических сетей. В конечном итоге, мне кажется что именно это, а не нейросети, является надежным путем к универсальному искусственному интеллекту.

Кажется, мы пытаемся прыгнуть сразу слишком высоко — сейчас компьютер со всеми его терабайтами и гигагерцами это по сути лишь среда для запуска браузера, текстового редактора и игрушек; а мы мечтаем сразу о сильном ИИ, который решит все наши проблемы. Забывая, что нужно пройти промежуточные этапы.
Тут главный вопрос нафига сильному ИИ решать наши проблемы? ;)
Главный вопрос — как сделать ИИ, пофиг какой, который таки будет решать наши проблемы.
UFO just landed and posted this here
UFO just landed and posted this here
Вот аналогия. С начала изобретения письменности люди в основном записывали тексты вручную. Но с появлением компьютеров мы научились пользоваться клавиатурами, а не стали ждать когда же там компьютеры научатся воспроизводить рукописный текст. А если бы стали ждать… до сих пор бы ждали, наверное. И насколько сложнее была бы инфраструктура.

Также и здесь. Я считаю что ждать, пока там компьютер научится полноценно понимать человеческий текст — слишком долго. Сейчас все наши компьютеры с их огромной вычислительной мощью — по сути просто мультимедийные комбайны, такие телевизоры с миллионом каналов. Т.е. со времен «революции 90-х» (GUI, мультимедиа, WWW) ничего по сути не изменилось, только окошки стали со всякими украшательствами, а некоторые программы вообще стали еще более тормозные чем их аналоги 20-30 летней давности.

Да я бы предпочел чтобы у компа был простой интерфейс как в 90-х, но зато он умел бы решать реальные задачи и проблемы, обдумывать, обсуждать, осуществлять научный и творческий поиск, изобретать… пусть не совсем самостоятельно, пусть вместе с человеком — в диалоге, подсказывая и объясняя по запросу, представляя информацию в разных видах и детализациях — словно бы вращая 3D-модель сложной детали в какой-нибудь CAD, и одновременно следуя высокоуровневым интуитивным инструкциям человека.
На первый взгляд мысль здравая. Но как только начинаешь углубляться в частности, то вылазит такое, что не всегда понятно как это сводить. И проблема даже не в языке как таковом, а скорее в «культурном контексте». Даже в одном языке в одной и той-же ситуации разные люди могут использовать разные выражения:
— здравствуйте
— доброе утро
— привет
— хай, чувак
и т.д и т.п.

В обычных текстах, особенно при переводе, это тоже вылазит во всей красе…
Да, я думал и об этом тоже. Каждое слово или фраза должны кодифицироваться каким-то образом, отражающим эмоциональное наполнение и прочие гуманитарные аспекты применения. Это кстати позволит трансформировать тексты — делать их с нужной эмоциональной окраской, для конкретной целевой аудитории и т.д.
Скучный мануал? Выбираем в меню другой стиль, и получаем статью в стиле журнала «Хакер»:)
Doors opened again and a merrily looking man stepped in. Or rather rolled in.

перевёл как
Двери снова открылись, и вошел весело выглядящий мужчина. Или, скорее, вошёл.

я всё понимаю, но буква «ё»…
Ну, хоть один электронный болван умеет букву «Ё» писать в словах. Респект ему!
Тааак, проверим… Берём сложносочинённое предложение на русском языке и смотрим, что выдаётся на выходе на английском языке:

«Не заметив, что на мосту, где было совершенно темно, шоссе, давно требующее починки, о которой некому было позаботиться, размыто дождями, в этих местах почти не прекращающимися, покрыто выбоинами, заполненными, о чем было нетрудно догадаться, густой грязью, завалено мусором, велосипедист, как мешок с картошкой, со всего маху свалился в яму.»

«Not noticing that on the bridge, where it was quite dark, the highway, which had long been in need of repair, which had no one to take care of, was blurred by the rains, in these places almost constant, covered with potholes filled, which was not difficult to guess, dense mud, swamped with garbage, cyclist, like a sack of potatoes, with all the fly fell into the pit.»

На «интеллектуальный» перевод мало похоже. На смысловой перевод — тем более. И вот почему:
1. Смысловой кластер «cyclist fell into the pit» не выделен и не поставлен во главу предложения в соответствии с правилами английской грамматики.
2. Идиоматические выражения типа: «со всего маху» переводит подстрочным методом конца 70-х годов прошлого века.
3. Инкрустированные в смысловые конструкции пояснительные обороты не выявляются первичным анализом текста на русском языке и потому на языке перевода выглядят неграмотно.

А с чем сравнить?
Вот перевод от Яндекс:

«Without noticing that on the bridge, where it was completely dark, the highway, long in need of repair, which no one could take care of, was washed away by the rains, in these places almost non-stop, covered with potholes, filled, as it was easy to guess, with thick mud, littered with garbage, the cyclist, like a bag of potatoes, fell into the hole at full speed.»

Не лучше справляется и Гугл:

«Not noticing that on the bridge, where it was completely dark, the highway, which had long needed to be repaired, which no one had to take care of, was washed out by the rains in these places almost not stopping, covered with potholes, filled with what was easy to guess, thick dirt, littered with garbage, a cyclist, like a bag of potatoes, fell into the pit from all over.»

Желательный по качеству английский вариант перевода должен быть хотя бы на следующем уровне:

<The bicycle-rider fell down into pit likewise a bag with potatoes not noticing that the highway on the bridge, where it was completely dark and no one long time had to take care of about it’s repair demanding, is blurred by rains in these places almost not stopping, covered with potholes, thick by mud, that was not hard to guess, and filled with garbage.>

В этом случае можно говорить уже об «интеллектуальном» или «смысловом» переводе.

UFO just landed and posted this here
Последнее время переводчик от Google часто выдает очень посредственный результат при переводе с английского на русский и наоборот. Бывает слова вообще не согласованы между собой. По моему мнению, переводчик от Яндекса для пары русский-английский сейчас лучше. Было бы интересно посмотреть на результаты слепого тестирования с его участием.
А DeepL молодцы. В некоторых случаях их переводчик выдает вообще идеальный результат.
Какой быстрый и демонстративный отклик в комментах…
К сожалению, повсеместное использование искусственных нейросетей везде, где нужен человек разумный, стало какой-то модной тенденцией. На мой взгляд, пока мы (человечество) подходим к задачам ИИ экстенсивно, упрощенно и потребительски, мы просто греем воздух миллиардами вычислений миллиардов коэффициентов.
Нейросети сейчас скорее обладают способностями животных, которое можно натренировать выполнять примитивные и однообразные действия: «заметить» объект в гуще объектов, воспроизвести «наиболее похожее» поведение в каком-то процессе и т.п. Животное даже что-то понимает, но вот далеко не всё…
Да, мы построили экскаватор, которым быстро и удобно копать, у нас неплохо получаются экскаваторы, технологию их клонирования мы освоили. Но почему мы решили, что этим же путем мы «осознаем» химические или физические процессы в грунте?
Недаром нейросети практически неприменимы в криптоаналитических задачах. И если рассматривать человеческую коммуникацию на естественном языке, как процесс вскрытия зашифрованного смысла, то и вывод о слабой применимости существующего нейросетевого подхода становится очевиден.
С итальянского на русский переводит не лучше Гугла, хотя несколько иначе. На порядок лучше переводит текст, написанный заглавными буквами. Гугл, как правило, в этом случае пишет полную чушь.
Оффтопик: многие публичные переводчики продвигали фичу «улучшить вариант перевода», после чего появились статьи о вандалах по аналогии с вики.
А как сегодня дела на этом фронте?
1) например, имеет ли смысл загонять туда по этой фиче все местные хабра-переводы — ведь они часто явно лучше необработанного публично-бесплатного варианта;
2) писать про вандалов мода прошла, или они сами «вымерли» как «сомалийские пираты»(тм)?
3) на многих сайтах давно есть фича «исправить опечатку», но мои волонтерские потуги применительно к Медузе и НоГа показали, что они ничего не меняли даже через месяц — и я плюнул. А у кого-нибудь был однозначно положительный опыт с улучшением публично-бесплатного варианта перевода?
4) что еще я забыл спросить? (с)
Only those users with full accounts are able to leave comments. Log in, please.

Other news