Как стать автором
Обновить

Комментарии 21

Олег… Тиньков такой Тиньков :)
А при не вежливом обращении к боту вам заблокируют счёт.
Црт, если я верно понимаю, это ребята, которые купили прогу «читатель»

Читатель — было лучшее приложение для воспроизведения голого текста голосом. Конечно, воспроизведение прогой не сравнить с тем, как читает живой человек, но если выбирать из существующих — лучшее. Я через него много книжек послушал.
К сожалению, новые владельцы перестали развивать приложение и с апгрейдом ios на айфоне это приложение умерло :((

Ещё у них есть прога, которая из mp3 сделает word (типа файнридера для голоса).
Пару лет назад я проверял — работало так себе.
Но опять же, других решений просто нет :((

Если кто знает рабочую прогу на windows, которая умеет выдать в текст диктуемое голосом — поделитесь плиз

Вы точно искали? Еще в 1999 году была прога Dragon Dictate (Горыныч в русском варианте), думаю, хуже не стало.
Вот:
http://ru.lmgtfy.com/?q=%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0+%D0%B4%D0%BB%D1%8F+%D0%B4%D0%B8%D0%BA%D1%82%D0%BE%D0%B2%D0%BA%D0%B8+%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0

Попробую, спасибо
А чем Вам гугловый сервис Speech-to-Text не подходит? Русский поддерживает (и еще 120 языков), пунктуацию ставит. Насколько мне известно, для Ютуб они генерируют субтитры тоже на этом движке. Можете включить любое видео с русской озвучкой и посмотреть качество распознавания.
Знаком с технологиями воспроизведения и восприятия голоса у ЦРТ… им ещё лет 5-10 работать до текущего мирового уровня.

Хотелось бы узнать, почему вы так считаете?


Как минимум синтез на русском языке у них работает весьма неплохо по сравнению с тем же гуглом. Желающие могут сравнить сами, у них есть демо на https://voicefabric.ru/ Там правда нет Варвары, о которой речь в новости, но есть другие женские голоса.

Не сильно лучше Яндекс/Гугл, а лицензирование просто космос, мы как то подсчитали для нашего небольшого колл-центра, выходило 1.5млн в год, поэтому клиентов у этого ЦРТ — 2,5 компании. Технологии почти все on-demand, работает все на Windows, API жутко не удобное. Облачная версия API с движка — космически дорогая. Как итог ЦРТ еще лет 5-10 работать до текущего мирового уровня.

Да, тоже с таким сталкивался у них. Но мой вопрос к комментатору выше был больше про сами подходы к синтезу/распознаванию.


ПС. Если не секрет, у кого в итоге купили голосовой движок?

Так вы только на цены жалуетесь, почему 5-10 лет?
А вот такой вопрос на обратную тему — а что там с распознаванием речи, и более того есть ли щас что-то что худо-бедно распознает японский?
Пока Алиса — единственный голосовой ассистент, с которой можно поддерживать беседу на русском языке. К сожалению, американские Сири (Apple), Алекса (Amazon) и Кортана (Microsoft) понимают только английский и не могут составить конкуренцию российским «девушкам» на местном рынке.

Со 2го абзаца ложневерная информация: google assistant и сири вполне понимают русский язык. Что за неподготовленность?
Ализар Копи-паст же.
Письма и сообщения она озвучит, только если услышит голос пользователя и распознает его как живого человека, а не запись

А это как, простите? На каждый запрос человек будет проговаривать капчу?
Ну вот ещё одним голосовым помощником будет больше. Интересно кто-нибудь уже организовывал беседу двух голосовых помощников?
на подобии хомячков-повторюшек



Предполагается, что она будет поддерживать биометрическую авторизацию (возможно, распознавание хозяина по голосу)

Чтоб товарищу майору не напрягаться.
Как-то пробовал стравить двух Алис на смартфонах. После нескольких пробных попыток, рекорд получился 10 минут их болтовни, без вмешательства человека.
Прикольно, только я картавый…
Как прочитал-Олег, сразу вспомнил программу Однажды в России.Там персонаж был отбитый на голову-Олег… Надеюсь не будет дежавю
Сейчас есть боты звонилки. Наверно, есть боты автоответчики. Вот хочется в живую увидеть, как Варвара будет общаться с Алисой )

Кейс может за уши притянут, но суть — бот с ботом.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости