wtigga 23 мая 2017 в 11:40

OmegaT: переводим с помощью компьютера

13 мин

32K

Софт Изучение языков

Туториал

+27

Комментарии 29

CarambaPirat 23 мая 2017 в 12:08

Когда-то переводил статью несколько лет назад. Вроде как программой OmegaT. Пробовал разные вещи, но именно двух-страничный режим с синхронизацией мне помог. Но по-моему я пользовался дополнительно программой словарем, хотя могу ошибаться.

wtigga 23 мая 2017 в 12:08

«Двухстраничный режим»? Вероятно, это было что-то другое :-)

g8tguy 23 мая 2017 в 12:27

Ой как же это удобно — особенно для вдумчивых переводов! В качестве десктопного переводчика еще очень помогает GoldenDict с толковыми словарями EN-EN — 谢谢

wtigga 23 мая 2017 в 12:27

Тоже GoldenDict пользуюсь, надёжнее чем онлайн-словари.

hmpd 23 мая 2017 в 13:32

Статья отличная. Спасибо!

1. В опросе не хватает пункта «SDL Trados»: SDL ведь купил их несколько лет назад.
2. Если говорить о сопоставлении сегментов оригинального текста и перевода, можно вспомнить еще WinAlign (входит в состав старого Традоса).
3. По моим ощущениям, главный недостаток при переводе с помощью CAT-программ — необходимость строго соблюдать структуру оригинала. Для работы с техническими текстами, документами и т. п. это подходит прекрасно, но вот с чем-то более художественным работать уже не очень удобно. Наверное, так и должно быть, все-таки перевод «художки» — это отдельная область.
4. Глоссарии и проверку текста по ним жутко удобно использовать для языков с бедной (англ.) или отсутствующей (кит.) морфологией. Тот же русский язык уже вызывает трудности: термины опознаются не всегда и не везде, потому что могут стоять в косвенном падеже или какой-нибудь особой форме.

Резюмируя: CATом можно зарабатывать неплохие деньги при переводе инструкций и всякого такого. Особенно если заказчик не прислал готовую «память перевода» (translation memory) и не знает, сколько в тексте новых сегментов (за них платят 100%), а сколько повторений (за них дают 20%).

Вопрос автору: насколько стабильна OmegaT? Можно использовать «в продакшене» или она годится только для фриланса? (Что касается перевода на КДПВ: пропущено тире в последнем предложении.)

wtigga 23 мая 2017 в 14:37

1. В опросе не хватает пункта «SDL Trados»: SDL ведь купил их несколько лет назад.

Упс, так и сделал опрос изначально, но что-то пошло не так :(

насколько стабильна OmegaT? Можно использовать «в продакшене»

Если под стабильностью понимать «не крашится ли с эксепшном» — то стабильна уже пару лет, во всяком случае stable-ветка. Впрочем, я сижу на latest и там не видел никаких проблем.

Но нужно принимать во внимание особенности работы, такие как костыль для разделения/сращивания сегментов, и поведение спецсимволов в памяти перевода. С последним я до конца не разобрался, то ли баг, то ли я что-то не так делаю.

Кроме того, я намеренно не покрыл в туториале командную работу: правильная настройка SVN и выстраивание рабочего процесса через него заслуживает отдельной статьи, потому что geek way и совершенно не дружелюбно к пользователю. Что, в общем-то, не мешало использовать OmegaT на моём предыдущем рабочем месте для команды из нескольких человек.

kaze_no_saga 23 мая 2017 в 16:44

>>правильная настройка SVN и выстраивание рабочего процесса через него заслуживает отдельной статьи

А вот это было бы чертовски интересно лично для меня. Ждем, верим.

wtigga 23 мая 2017 в 17:08

Я сам настраивал по инструкциям из интернетов. Чтобы нормально написать, это по хорошему бы опять начать проект минимум на два человека, иначе не описать все особенности и возможные подобные камни.

Я занесу в «ту-ду» со средним приоритетом :))

LazyTalent 19 июл 2019 в 18:21

Вот эти товарищи используют омегу для первода инструкций уже пару лет.

wtigga 19 июл 2019 в 18:23

in-house или на аутсорсе? не вижу в вакансиях у них ничего языкового

LazyTalent 24 июл 2019 в 14:58

аутсорс

AleCC 23 мая 2017 в 17:59

Если переводить по одному слову иди фрейзел вербс, то эби лингво.

wtigga 24 мая 2017 в 04:24

По-моему, вы не читали статью :)

betrachtung 24 мая 2017 в 06:59

Я обычно пользуюсь для перевода translated.by, очень удобный двухколоночный интерфейс, привязка к мультитрану. Тут стоит учесть, что я любитель, перевожу обычно новости какие-нибудь. Иногда перевожу сложные тексты для друзей, но от этого у меня мозг пухнет.

Iamkaant 24 мая 2017 в 08:16

Спасибо за статью! Очень полезная инструкция для начинающих. Я пользуюсь open source везде, где это возможно, но Омега в моей практике не прижилась. По моему мнению, интерфейс очень непродуманный и не выдерживает никакого сравнения с Memsource/Smartcat. Из претензий – отсутствие двухпанельного режима (не бейте сильно, если я просто не нашел его), отсутствие визуального выделения важной информации (куча циферок в строке статуса), замороченная процедура работы. Но и это терпимо, если бы не сложности с машинным переводом. С Яндексом у меня почему-то не получилось, остальные сервисы платные. Отдельное спасибо Вам за инструкцию по Яндексу, но для Украины это уже не актуально :) Большим плюсом Омеги я считаю возможность править глоссарий на лету, в SmartCAT этого очень не хватает. В общем, прочитав статью, попробую ещё раз пожевать кактус, но ничего не обещаю :)

wtigga 24 мая 2017 в 08:22

Двухпанельного режима с превью документа действительно нет. По «визуальному выделению информации» не совсем понял, что имеется в виду.

Встроенный машинный перевод разве проблема омеги? Сервисы сами по себе платные (кроме яндекса), ничего тут не поделаешь.

Я живу за великим китайским файерволом, поэтому у меня уже определённая деформация сознания: везде, где можно, пользоваться standalone или self-deployed решениями. Потому что сегодня облако работает, а завтра оно закрыто навсегда. Независимо от масштаба. (ваша блокировка яндекса — это так, пустяки ещё).

Да и по скорости отклика интерфейса облачным решениям всё ж таки далеко до обычных программ.

Iamkaant 24 мая 2017 в 10:35

По поводу визуального выделения: вот скриншот SmartCAT

SmartCAT

Вверху прогрессбар, справа совпадения с цветовым выделением процента, подтвержденные сегменты отмечены выделяющейся зеленой галочкой, ошибки обозначены оранжевым треугольником. Теги выделены желтым (на скриншоте нет). Информации минимум, важное выделено.

Вот скриншот OmegaT

OmegaT

Процент выполнения показан внизу мелкими малопонятными цифрами, причем тут смешана и статистика по текущему документу, и по проекту в целом. Окно Fuzzy Matches: за процент совпадения тем же шрифтом, что и собственно текст, нужно бить по рукам. Окно Editor: теги сливаются с основным текстом, в самих тегах слишком много текста. Можно было бы делать, как в Poedit: просто циферка в скобках.

В целом, я положительно оцениваю OmegaT: проведена гигантская работа и это достойный инструмент переводчика, но к нему очень сильно нужно привыкать. Про скорость отклика с Вами согласен.

Связку Яндекса с Омегой попробую, open source нужно поддерживать. MS переводчик вроде тоже можно получить бесплатно, только нужно бумажной почтой отправить подписанный договор в Редмонд :)

Ну и еще раз поблагодарю Вас за руководство, вышло очень толково. Представляю, сколько времени ушло на написание. Если будет желание, сделайте что-то похожее об Okapi — там все еще запутаннее…

wtigga 24 мая 2017 в 10:40

У вас на скриншоте версия OmegaT семилетней давности :))))) Сейчас получше: теги сворачиваются в компактные (...<t1/>) и блокируются от редактирования по-умолчанию, например. Косметические вещи — да, омега в этом смысле выглядит сермяжно и не юзер френдли. С другой стороны, элементов там не так уж и много, запомнить их можно быстро.

Работа действительно идёт. В последнем релизе наконец-то вынесли все настройки в одно удобное окно конфигурации, на порядок лучше стало. И добавили LanguageTools к простому сверятелю тегов.

С Okapi я не так плотно работаю, пользуюсь время от времени для каких-то совсем простых операций. Гайд по омеге же писал по своему многолетнему опыту, в основном чтобы не объяснять кому-нибудь в н-цатый раз одно и тоже, а просто кидать ссылку (:

Iamkaant 24 мая 2017 в 10:45

А, и еще одно отличие вспомнил — в том же SmartCAT можно скачать один переведенный файл из проекта, в окне перевода. В Омеге, как я понимаю, нужно конвертировать в Word весь проект целиком.

Что ж, если разработка идет, то и мотивации использовать гораздо больше :) можно даже попровать feature request, вдруг прокатит.

wtigga 24 мая 2017 в 10:54

«Скачать один переведённый файл» — это всмысле «финальный файл» или «вытащить все тексты проекта»?

Если первое, то Project -> Current translated document, и будет сгенерирован текущий финальный файл в том формате, в котором был оригинал.

Если второе, то Tools -> Scripting -> Write Excel table, и будет сгенерирован эксель со всем контетом из проекта.

Iamkaant 24 мая 2017 в 10:59

Спасибо. Я о втором варианте: на любом этапе перевода можно вытянуть частично переведенный docx-файл из окна перевода, не переходя к окну проекта. Но это уже мои придирки и вкусовщина, т.к. я это использую для бэкапа выполненной работы. ABBYY тоже под санкции попал, мало ли…

wtigga 24 мая 2017 в 11:06

Тогда первый ответ :) В любой момент времени, не переходя к окну проекта, можно горячей клавишей сгенерировать готовые (или частично готовые) файлы. Даже скачивать не надо, всё локально ведь :)

Iamkaant 24 мая 2017 в 11:44

Спасибо. Вы меня убедили :)

nad_oby 24 мая 2017 в 20:27

Спасибо за статью.
Использовал OmegaT лет 8-9 назад.
Как раз юридические документы.
А вот программы переводил просто в текстовом редакторе Vim.
Там обычно .po или .xml и омега как то не прижилась.
Но это так по мелочам.
Про настройку репозитория для Ворд/Эксель было бы интересно.
Особенно прикрутили ли diff и если да то как?

wtigga 25 мая 2017 в 05:15

А что за «репозиторий для ворд/эксель»? И каким образом может пригодиться diff?

nad_oby 25 мая 2017 в 06:53

Репозиторий это тот самый SVN или git.
Настройки тоже интересны, но на самом деле workflow — это самое вкусное.
Переводчики обычно не технари, организовать совместную работу такой команды это плюс 100500 очков к знанию подводных камней.
Вот ими делитесь, если желание останется.

По ответу понятно что никакими diff-tool не пользовались.
Обычно такой инструмент нужен когда сводишь вместе работу двух разных людей в одном файле — merge.
Для языков программирования это достаточно тривиально, простой текст он и в Африке текст, большинство инструментов с ним прекрасно справляются.
Для Ворд/Эксель нормальных diff не находил, когда искал.
Часто можно вывернуться поделив большой файл на части и распределив их в команде.
Кроме Майкрософтовских е немало форматов для которых контроль изменений — боль.

wtigga 25 мая 2017 в 07:50

Я знаю, что такое дифф, но переводы — не программирование же :-)
Если над доком работает несколько человек по SVN, то синхронизация идёт достаточно быстро. Плюс омега может оставлять пометки о том, кто именно перевёл тот или иной фрагмент. Т.е. память перевода постоянно синхронизируется между переводчиками, и любой из них в любой момент может сгенерировать конечный файл.

Когда мы работали командой, то просто обуславливались, с какого по какой сегмент переводим. Либо делили на разные файлы, да. (со всякими key=value документами это не проблема).

Командная работа идёт по SVN, но версионность как таковая в омеге не задействована.

nad_oby 25 мая 2017 в 08:57

Тогда всё становится понятнее.
У меня около года назад стояла задача создать и поддерживать репозиторий для файлов Simulink, так разработчикам пришлось перейти к разработке без мерджей, только версии.
Инструменты для дифф/мердж существуют но стоили невменяемых денег.

Для вас может подойти использование инструментов, которые конвертируют Word/Exel на лету в текстовый формат (Markdown?), происходит слияние (merge), а затем, так-же на лету происходит конвертация обратно.
В идеальном случае, в репозиторий попадет только текст, а реальный документ будет использоваться в работе и как конечный результат.
Более менее представляю как это сделать на Git, с SVN придется курить мануалы.

Я бы попробовал в Git использовать в качестве хуков скрипты на основе pandoc.
Правда это может поломать разметку некоторых файлов.

Есть ещё word_diff на первый взгляд немного заморочно.
За то не придется ставить на машины ничего кроме Git клиента, конвертация в собственном облаке.

wtigga 25 мая 2017 в 11:43

У меня уже просто деформация сознания переводчика :-) Для меня нет «документов», вся лингвистическая информация должна храниться в ТМ (памяти перевода). На основе которой уже можно в любой момент сгенерировать нужный документ.

Зарегистрируйтесь на Хабре , чтобы оставить комментарий

OmegaT: переводим с помощью компьютера

Комментарии 29

Публикации

Истории