Как стать автором
Обновить

Комментарии 26

Вот эту софтину непросто будет русифицировать...:)
Уже представляю себе русификатор, превосходящий по стоимости саму программу.
Что там сложного?

1. Создать БД слов и синонимов.
2. Научить алгоритм учитывать лексические и грамматические отличия русского от английского.
3. Продать алгоритм гуглу.
4. ???
5. PROFIT!!!
Пожалуйста, поподробнее о п.4 Видимо, здесь и кроется вся трудность :)
Смысл моего комментария заключался в том, что переводчик, который имеет опыт перевода стихов RU — EN, знаком с теоретической базой (лексика, грамматика) и способен разобраться в исходном алгоритме (сам или с помощью программиста), сможет добавить поддержку русского языка в программу. Я не знаком с исходными кодами и алгоритмом работы, но предполагаю, что для этой задачи потребуется намного меньше ресурсов, чем потребовалось для разработки оригинального алгоритма.

Также я, не обладая актуальной информацией, сделал намек на то, что подобными исследованиями (а именно: открытыми исследованиями в области перспективных направлений развития IT и интернета вообще, проведенными группой энтузиастов) кто-то заинтересуется, и предположил, что это будет Google. Но когда я ознакомился с докладом, для меня не было неожиданным то, что разработчики уже тесно контактируют с вышеупомянутой корпорацией.

И наконец, насчет п. 4. Если вы откроете доклад и прочтете шапку, то с удивлением обнаружите, что исследователи нашли гениальное решение — они попросту его пропустили.
Было бы всё так просто, то величайшие умы математики и кибернетики 50-70-хх годов давно бы уже додумались до этого решения раньше, чем какой-то студент из далёкого для них 2010-го года. Ведь это на их разработках сделаны лучшие на данный момент времени переводчики.
Машинный перевод — это очень трудная задача.
> величайшие умы математики и кибернетики 50-70-хх годов давно бы уже додумались до этого решения раньше, чем какой-то студент из далёкого для них 2010-го года

Увы, у великих гениев прошлого не было того, что в наши дни есть у какого-то студента — персонального компьютера.

К тому же, основная часть алгоритма — не перевод, а подбор рифмы и размерности. Я это уже написал вот здесь:
habrahabr.ru/blogs/htranslations/105801/#comment_3319641

P.S. Пожалуйста, не стоит недооценивать студентов. Разум и интеллект приходят с опытом, а не с возрастом.
Вот это да. Google Translate и так уже удивляет своими переводами (довольно неплохими для машинных), а тут еще и стихи, и в рифму, и в ритм! Скоро переводчики останутся без работы :)

Было бы интересно Маяковского на английский перевести, с сохранением смысла, ритма. Не думаю что это будет легкой задачей, даже для такой программы.
У Google Translate очень плохой уровень машинного перевода. Он выезжает только за счет того что люди предлагают свой перевод который потом используется.
а интересно по стилю можно автора определять?

I am happy, I have kissed a woman,
I have slept in grass and flower-bed,
And I never, like a decent human,
Hit a dog or kitten in the head.
Не думаю, что это так просто. Ведь даже у Пушкина есть «Подражания», а поэты часто экспериментируют с формой и словами, смешивая стили. Разве что Шекспира в его староанглийском оригинале легко будет определить по употребляющимся словам…
Хм. Редко на Хабре бывает, что комментарий едва ли не лучше исходного поста.
Once upon a midnight dreary, long we pondered weak and weary,
Over many a quaint and curious volume of translation lore.
When our system does translation, lifeless prose is its creation;
Making verse with inspiration no machine has done before.
So we want to boldly go where no machine has gone before.


Отличная вариация на тему Эдгара По. Just translation, nothing more :)
Слышал такую поговорку от переводчиков — «Перевод — как женщина. Если красивая — то неверная, если верная, то — некрасивая»
А можно поинтересоваться, почему в статье перевод в основном с английского на английский?
Может быть, вы имели в виду «с французского»?
Нет, именно с английского. Есть примеры трансформации английского текста в поэтическую форму (на английском), и перевод системой Оскара Уайльда (опять-таки на английском). Мне гораздо интереснее было бы увидеть примеры перевода на русский — будет более понятен принцип работы алгоритма.
Насколько я понимаю принцип работы подобных алгоритмов, программа сначала переводит текст с языка источника на требуемый язык, а затем, с помощью списка синонимов и правил подстановки, рифмует полученный текст.
Отсюда следует, что:

1. С помощью этого алгоритма возможен перевод с исходного языка на исходный (да, именно перевод).
2. Имея алгоритм работы, можно с незначительными (в зависимости от выбранного языка; например, адаптация для русского займёт меньше времени, чем для китайского, поскольку русский и английский языки во многом схожи) изменениями адаптировать программу для работы с любым языком.
3. Разработчики при разработке подобной системы в условиях недостатка ресурсов реализуют лишь основной алгоритм и поддержку двух, возможно трех языков (родных языков разработчиков и английского).

З.Ы. Когда прочел статью, сразу пришла в голову мысль, что прототип алгоритма был чрезвычайно прост: брутфорсер текста через Google Translate плюс проверка размерности и рифмы.
Спасибо за развернутый ответ, стало немного понятнее.
Небольшое уточнение — я говорю про доклад, который доступен по ссылке в формате pdf.
Прошу прощения, я не был с ним знаком.
Конференция ЕМНЛП :)

По теме — думаю, получится достаточно неплохо, потому что стихи зачастую и на родном-то языке звучат так, что понимай как хочешь, а значит и на другом языке, если сохранить смысл, останется то же настроение. Правда, такой программе будет абсолютно бессысленно давать на перевод, например, Спайка Миллигана или других авторов, у которых в стихах присутствует игра слов. Тут машина будет абсолютно бессильна.
Down the river drifts an axe,
From the town of Byron
Let it float by itself
F**king piece of iron

PS: Молодцы ребята, очень интересно было бы попробовать систему в деле.
Down the river drifts a brick,
Wooden like a piece of glass.
Let it float by itself,
We don't need a styrofoam.
Только мне захотелось натравить эту систему на «Бармаглота» Л. Кэррола?
А был ли мальчик?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации