GeorgeR Jun 9 2011 at 10:16

Русский голос TED

1 min

1.3K

Self Promo

+79

Comments 64

madmaxcorp Jun 9 2011 at 10:21

Таки надо оригинальную звуковую дорожу делать тише, а то треш какой-то получился.

GeorgeR Jun 9 2011 at 10:29

Заменил ролик на более правильный по звуку. Остальные ролики здесь.

madmaxcorp Jun 9 2011 at 10:32

О, теперь хорошо.

FuN_ViT Jun 9 2011 at 10:41

очень недурно!

kimi44 Jun 9 2011 at 10:59

Мне очень понравилось слушать эти переводы и они очень хорошо отражают научный подход TED. Очень иронично показалось слушать историю о человеке потерявшем голос таким переводом. Теперь на работе удобно слушать TED, я хотел бы, чтобы вся переведенная на русский база TED была озвучена подобным образом.

iambot Jun 9 2011 at 11:05

Вы специально строите свои предложения, чтобы они были похожи на машинный перевод?

+16

GeorgeR Jun 9 2011 at 11:13

Переводы берутся из субтитров, созданных усилиями сообщества TED.
Все процессы представленного проекта предельно автоматизированы.

buger Jun 9 2011 at 11:29

Я так понимаю все равно какой то тюнинг проводится. Потому что в демо на сайте vitalvoice.ru/demo/ далеко не так хорошо с интонациями и знаками препинания.

GeorgeR Jun 9 2011 at 11:31

Новая версия движка на совершенно иных принципах. На демо еще не обновили.

kimi44 Jun 9 2011 at 12:44

Ага, писал сразу после просмотра видео, втянулся видимо. Сейчас перечитал и правда похоже на машинный перевод. Иронично, что мне это заметил человек с Вашим никнеймом. =)

egavrin Jun 9 2011 at 11:00

Это синтезируемая речь? Я не верю!

hx0 Jun 9 2011 at 17:27

Да, неплохо, но прослушиваются «провалы» в голосе подобно таким как в festival.

Roler Jun 9 2011 at 23:10

Или мне кажется, или иногда голос прямо посередине слов как будто реверберирует.

Demir0 Jun 10 2011 at 03:36

А я не верю, что можно принять ее за настоящую. Да, очень круто, иногда даже похоже. Но давайте без пафоса.

Fatal_Error Jun 9 2011 at 11:01

Хорошая реклама от Dodge на эту тему ) www.youtube.com/watch?v=Qw7_UTk0d6Y

sp1se Jun 9 2011 at 11:01

А технология может работать real time? Я уже представил как это толкнет IT стран СНГ вперед...:)

GeorgeR Jun 9 2011 at 11:03

Может.

Antigluk Jun 9 2011 at 11:06

Это просто невероятно.
А субтитры делаются вручную или генерируются системой распознавания голоса?

LiDeBr Jun 9 2011 at 14:32

Вручную, конечно.

UFO just landed and posted this here

ckkpss Jun 9 2011 at 18:19

ну да, очень неплохо изучить два-три десятка языков. ну и умереть потом спокойно, ощущая себя интеллектуалом

UFO just landed and posted this here

Reey Jun 9 2011 at 23:13

А все серии рабыни Изауры — на португальском.

Demir0 Jun 10 2011 at 03:40

Зная два-три десятка языков, человек уже не просто знает два-три десятка языков. Странно это объяснять [вроде бы] образованному человеку.

kuber Jun 9 2011 at 11:09

Хорошо, даже очень Хорошо.

sp1se Jun 9 2011 at 11:12

Насчет голоса скажу вам, что после американских фильмов 90-ых годов, нас жителей постсоветского пространства не испугаешь приятным голосом и дикцией робота))

+13

Shark Jun 9 2011 at 11:14

VoiceFabric — это скорее материя речи, чем фабрика речи.

Aracon Jun 9 2011 at 23:41

Но на логотипе буквы I оформлены в виде труб, из которых валит дым (в форме «комиксного облачка»), что тоже намекает на «фабрику».

Elijah Jun 9 2011 at 11:17

Робоголос действительно хорош, как и идея русской озвучки TED.
Единственное, что «резануло» по глазам — название («Фабрика речи» VoiceFabric), fabric в английском языке — это ткань, материал, а никак не фабрика.

darkolorin Jun 9 2011 at 11:18

На уровне, иногда бывают огрехи, но очень приятно что теперь я могу послушать выступления известных специалистов по космологии и квантовой физике. Жду продолжения.

GeorgeR Jun 9 2011 at 11:25

Каждый четверг — 10 новых роликов.

darkolorin Jun 9 2011 at 11:26

Теперь буду ждать как сериал :)

kimi44 Jun 9 2011 at 12:47

А чем обусловлено такое ограничение? Просто очень интересно. Ресурсоемкость технологии, лицензионные ограничения, необходимость ручной доводки материала или желание растянуть интерес зрителя сериальной моделью?

GeorgeR Jun 9 2011 at 13:08

сериальная модель, отчасти :)
С другой стороны — залить 10 роликов на vimeo + их оформить (ввести описание, поставить ссылки) + оформить на сайте, продумать, где оставить, чтобы заметили :) вообщем ресурсоемко.
сам процесс озвучки занимает где-то на 1 час видео — 5 минут работы движка.

Dr_Logic Jun 9 2011 at 11:18

Очень интересно — интонация в голосе выбирается автоматически основываясь только на пунктуации или каким-то образом используется оригинальная звуковая дорожка? Может быть вообще ее правил редактор?

GeorgeR Jun 9 2011 at 11:26

Редактор ничего не правил :)

diomas Jun 9 2011 at 11:22

Здорово! осталось только «булькание» убрать и будет не отличить

ckkpss Jun 9 2011 at 18:23

насколько я понял, бульканье появляется, когда робот торопится. когда медленно говорит — вообще незаметно, что это не человеческий диктор.

всплывает проблема английского языка с его словами, более короткими, чем наши. думаю, в случае с немецким будет проще.

eRaider Jun 9 2011 at 11:23

Клево, но как убрать английскую дорожку?

GeorgeR Jun 9 2011 at 11:34

С оригинальной дорожкой двойственная история. С одной стороны — она конечно мешает. С другой — помогает, так как из нее слушателем подсознательно берется оригинальное интонирование и эмоциональная окраска. А как известно, роботы хуже всего справляются с эмоциями.

eRaider Jun 9 2011 at 11:45

Согласен, но может быть, ее сильнее приглушить? Приходится вслушиваться в русский текст.
Показалось, что русская речь немного отстает от английской, из-за этого интонации и акценты смещаются. Вы не подгоняли перевод так, чтобы он примерно попадал в английский темп?

GeorgeR Jun 9 2011 at 11:56

Это самая интересная с точки зрения реализации задача.
Проблема ведь в том, что английская речь и русская разная по длительности звучания отдельных предложений. Английская короче. Поэтому синтез должен успеть произнести русское предложение и еще успеть его «привязать» (по смыслу и месту) к оригинальному звучанию. Профессиональный перевод (человеческий) справляется с этой задачей тем, что просто не все что говорится озвучивается. Плюс к этому человек-дублер работает на различных темпах. У синтеза тоже есть разные темпы, но звучит это неприятно для уха, когда одна фраза спокойная по темпу, а другая — с места в карьер.

GeorgeR Jun 9 2011 at 13:50

И есть еще небольшая хитрость. Начало каждой фразы роботосинтеза смещено по отношению к оригиналу во всех роликах на 1,5 сек. Для достижения «эффекта Володарского», так сказать :)

Dr_Logic Jun 9 2011 at 11:26

Кстати, то ли технология другая то ли синтезированный голос «подтюнили», но на сайте продукт «RSS-радио» синтезирует голос на порядок «роботизированней» speechpro.ru/techno/synthesis -> rssradio.ru/

GeorgeR Jun 9 2011 at 11:30

Новая версия движка на совершенно иных принципах. На демо еще не обновили.

stasxp Jun 9 2011 at 11:33

Google уже хочет вас купить =)

Antares19 Jun 9 2011 at 11:47

2:55 «Понимаете ли вы что все они [аварии] стали следствием человеческой ошибки, а не ошибки машины… И могут быть предотвращены с помощью той же машины.»

Когда ситнезированный голос, говорит про ошибки человека и предлагает заменить человека на машину — это как-то очень напоминает GladOS из Portal :)

ps: Проект отличный! Будущее здесь.

osmirnov Jun 9 2011 at 11:52

Спасибо. Очень интересно, как IT специалисту. Немного неинтересно, как человеку, изучающему английский язык с помощью TED.

Levsha100 Jun 9 2011 at 12:01

Неужели мы дожили до этого момента?
Просто суперовая технология!
Будущее здесь!

mkevac Jun 9 2011 at 13:18

> Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык.

Почему приятно? Вы не знаете английский язык? Вы, пишуший на Хабрахабре. Сайте об IT. Ужас…

-6

fp71g Jun 9 2011 at 13:57

Поверьте, не все знают английский настолько хорошо, чтобы нормально понимать разговорную речь

mkevac Jun 9 2011 at 14:00

Я верю. Поэтому надо не переводить и тормозить процесс обучения, а изучать долбанный английский язык!

webhamster Jun 9 2011 at 14:42

Интонирование речи приятно удивило. Как это достигается? Расставить правильные интонации — это очень сложная задача.

С синтезом, конечно, косяки вылазят. Форманты плохо стыкуются. Не пойму, в чем проблема добиться гладкой стыковки?

Shuisky Jun 9 2011 at 15:05

Птица Говорун)

Alexsey Jun 9 2011 at 16:08

Очень впечатляет

ckkpss Jun 9 2011 at 18:27

я понял, что это не человек, только когда он начал заикаться в середине.

и голос очень приятный, бархатистый. надеюсь, диктор, отдавший его бездушной машине, не будет распят какой-нибудь актёрской гильдией ;)

GreenAngel Jun 9 2011 at 19:24

Очень впечатляет! А скоро у простых юзеров появится возможность использовать Вашу технологию?

RedWorker Jun 9 2011 at 19:33

У меня на базе ЦРТ работает автоматическое радио — bot.fm
Просто выделяешь любой текст, выбираешь голос, жмешь внопку — оно озвучивается и вставляется тебе в боткаст.