Как стать автором
Обновить

Комментарии 26

А просто обращаться посредством запросов можно?
Что касается качества распознавания:
— 80% общих запросов, которые делают пользователи интернета;
— 94% географических запросов.

А на изображениях 84 и 94 ;).
Спасибо, подправил.
А что такое «географические запросы»?
«стеклопакеты петербург»? «шаверма московская площадь»? «как пройти в библиотеку»?
Я так понимаю, географические запросы — это запросы, содержащие названия улиц, населенных пунктов и т.д. Возможно, конечно, что они как-то комбинируются и с «обычными» запросами.
Яндекс.Спички
Яндекс плотно и успешно повторяет все, что выкатывают сами-знаете-кто, с дельтой в полгода-год. Молодцы. Скоро ли на экранах лада-самоходка? Ждем же.
Сначала операционка для смартфонов. Было бы любопытно.
скорее всего это будет мод Андроида, судя по истории с браузером.
Очень круто было бы, если бы эта библиотека работала оффлайн.
Нужна подобная технология для русскоязычной Siri
С Сири проблема не в распознавании, Эпл пользуется Нюансом, и у них уже давно есть распознавание русского, им-то и Яндекс до теперь пользовался.
А что под капотом? Стандартный HMM-GMM и взвешенные автоматы для декодинга? В качестве языковой модели — n-gramm'ы? Как работаете с фонемами?

Не думаю что это такая уж закрытая информация. С другой стороны, интенресно же :).
Спасибо.
Да, интересно было бы прочитать про технические детали.

Я не специалист совсем, но…
Пишут про 300 часов мужской и женской речи. Разве это не мало?
Качнули бы книг в аудио формате — текст есть, речь есть. Только обработать немного. Или по крайней мере как хороший тест.

И потом, ни слова о «HTML5 Web Speech API», которое работает в хроме не только на андройде.

Это мы с вами «качнули». А Яндексу придется «лицензировать».
Полагаю есть книги под свободными лицензиями, или классика не подпадающей под таковые…

Если я Толстого начитаю на диктофон и выложу в сеть с пометкой, что можно мою запись свободно использовать это же не будет нарушением
чьих-то прав?
Я написал в той теме ответ. Сейчас я в отпуске, и у меня лирическое настроение, так что не воспринимайте категорично :)
Запилите же, наконец, Яндекс.Торрент! ))
немного не понял, для распознавания нужно соединение через Инет или не нужно? Если нужно Мнтернет-соединение, то нафига она нужна? Есть Google Speech API, который очень даже неплохо понимает русскую речь и еще 50 с лишним языков.
Судя по всему распознавание идет в онлайне, отсюда вопрос, а нафига оно нудно если есть Google Speech API?

Или у яндекса не хватило денег на лицензию от Nuance на ядро распознавания в оффлайне?
А вы вообще слышали о слове «конкуренция»?
Согласен с Вами и уверен, что полученные наработки Яндекс сможет успешно использовать и в других своих проектах, совершенствуя их.
Очень приятно, что хоть кто-то умеет работать!
а кто не умеет?
И все тот же вопрос, который я задаю сотрудникам Яндекса уже в который раз: с результатами тестирования и предложениями по улучшению вы работаете?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации