Someonesolitude Dec 18 2011 at 22:43

Распознавание и синтез речи в любое приложение под iOS за час

12 min

11K

Development for iOS*

+37

Comments 18

seonik Dec 19 2011 at 04:17

Полезная статья. Есть пара вопросов:
— Как долго нужно ждать синтезированную речь? Вы уже экспериментировали?
— Распознает только английскую речь?

MYPABEU Dec 19 2011 at 09:12

Dragon Dictation вполне неплохо и русскую распознает.

Someonesolitude Dec 19 2011 at 11:42

привет. 1). синтезированная речь — дело нескольких секунд (в зависимости от длины текста). сам не экспериментировал с этим, могу точно сказать, что в пределах 8 секунд

2). все сервисы поддерживают русский язык и еще кучу других помимо английского

int03e Dec 19 2011 at 10:22

Спасибо за статью! А как распознавание по сравнению с сири?

Someonesolitude Dec 19 2011 at 11:43

по качеству распознавание от Nuance и Siri абсолютно идентичны

maxmert Dec 19 2011 at 11:03

Ставил Dragon на iPhone. Распознавал ужасно (особенно когда технический текст). Предполагаю, что SDK использует те же библиотеки. Но так как отсутствуют альтернативы, то на данный момент это, видимо, лучшее приложение, распознающее русскую речь. Кстати, удалил через 20 минут – набирать оказалось быстрее.

Someonesolitude Dec 19 2011 at 11:46

вообще тут дело вот в чем (знаком с этим приложением) — когда вы пытаетесь диктовать технический текст, то не задумываетесь, есть ли в языковых базах то или иное слово. Dictation задумывался как диктовка чисто бытовая, а технические и любые нужные словари можно заказывать на этот app опционально (правда не совсем представляю, как). можт с этим и низкий процент распознавания связан

SAKrisT Dec 19 2011 at 14:37

поставил, русский еще кое как у меня распознает, а с англ хреново…

Pilot34 Dec 19 2011 at 11:05

Я правильно понимаю, что это как и Siri все через сервер работает, да?

И в ту и в другую сторону? А edge хватает для работы?

Someonesolitude Dec 19 2011 at 11:47

стандартного моб.интернета хватает, ага. работает через сервер

Omega Dec 19 2011 at 13:40

а как дело обстоит с детскими голосами? реально, если применять для распознаваня в детских обучающих приложениях?

brainplus Dec 19 2011 at 15:07

ссылка на faq битая.

brainplus Dec 19 2011 at 15:12

Все-таки это убожество — все через сеть гонять.

Вот у нашей Питерской фирмы Speereo.com движок синтеза и распознавания речи не требует инета. Они единственные с оффлайновым синтезом и распознаванием — всякие гуглы, эплы и прочая обломались что-то сделать, работающее оффлайн.

Ну и у speereo.com есть и облачные решения тоже (когда голос облаком распонзается и синтезируется) — о них они писали на хабре.

Someonesolitude Dec 19 2011 at 15:42

честь и хвала такому оффлайновому чудо-движку, и успехов вашему начинанию

TataLee Dec 19 2011 at 20:26

Если офлайновый синтез ставить в мобильное приложение, сколько оно весить будет? Из этого действительно можно сделать что-то удобоваримое для мобильной операционки, не особо загружая память? Есть примеры интеграции?

brainplus Dec 19 2011 at 21:36

я немного не правильно выразился — я там не работаю, «наша фирма» = «российская фирма».

Примеры интеграции на сайте. В частности всякие голосвые переводчики под симбиан. Про базы для распознавания — вроде там написано.

Я бы лично готов таскать 1ГБ данных на айфоне, чем в международном роуминге платить $10 за мегабайт мобильного инета (ведь сколько там передача голоса жрет трафика — хз).

sgzmd Dec 19 2011 at 21:33

Подождите, я не понял… то есть Apple не предоставляет готовых интерфейсов голосового ввода/вывода что ли?!

Someonesolitude Dec 19 2011 at 22:04

нет, предоставляются (не Эпплом а Ньюансом) компоненты клиента и сервера (весят несколько сотен килобайт), которые встраиваются в код приложения, а сервисы сами по себе онлайновые, т.е. запрос на обработку речи в текст или текста в речь по-любэ уходит на сервера и оттуда возвращается юзеру в нужном виде. занимает несколько секунд в зависимости от веса и скорости инета.
разработчику, подключившемуся к сотрудничеству «Silver» это ничего, кроме некоторого времени на внедрение, стоить не будет

Show the best of all time