steff 2 окт 2013 в 20:28

Голосовой поиск «по-русски»

1 мин

31K

Поисковые технологии*API*Яндекс API*

+48

Комментарии 26

Arei 2 окт 2013 в 21:20

А просто обращаться посредством запросов можно?

Licwin 2 окт 2013 в 22:36

Что касается качества распознавания:
— 80% общих запросов, которые делают пользователи интернета;
— 94% географических запросов.

А на изображениях 84 и 94 ;).

steff 3 окт 2013 в 01:29

Спасибо, подправил.

unxed 3 окт 2013 в 01:13

А что такое «географические запросы»?
«стеклопакеты петербург»? «шаверма московская площадь»? «как пройти в библиотеку»?

steff 3 окт 2013 в 01:29

Я так понимаю, географические запросы — это запросы, содержащие названия улиц, населенных пунктов и т.д. Возможно, конечно, что они как-то комбинируются и с «обычными» запросами.

SLY_G 3 окт 2013 в 01:14

Яндекс.Спички

+11

akhmelev 3 окт 2013 в 01:46

Яндекс плотно и успешно повторяет все, что выкатывают сами-знаете-кто, с дельтой в полгода-год. Молодцы. Скоро ли на экранах лада-самоходка? Ждем же.

unxed 3 окт 2013 в 03:17

Сначала операционка для смартфонов. Было бы любопытно.

rule 3 окт 2013 в 03:41

скорее всего это будет мод Андроида, судя по истории с браузером.

rule 3 окт 2013 в 03:45

Очень круто было бы, если бы эта библиотека работала оффлайн.

sanche006 3 окт 2013 в 09:30

Нужна подобная технология для русскоязычной Siri

Djamah 3 окт 2013 в 10:09

С Сири проблема не в распознавании, Эпл пользуется Нюансом, и у них уже давно есть распознавание русского, им-то и Яндекс до теперь пользовался.

lightcaster 3 окт 2013 в 09:31

А что под капотом? Стандартный HMM-GMM и взвешенные автоматы для декодинга? В качестве языковой модели — n-gramm'ы? Как работаете с фонемами?

Не думаю что это такая уж закрытая информация. С другой стороны, интенресно же :).
Спасибо.

macik_spb 3 окт 2013 в 15:36

Да, интересно было бы прочитать про технические детали.

Я не специалист совсем, но…
Пишут про 300 часов мужской и женской речи. Разве это не мало?
Качнули бы книг в аудио формате — текст есть, речь есть. Только обработать немного. Или по крайней мере как хороший тест.

И потом, ни слова о «HTML5 Web Speech API», которое работает в хроме не только на андройде.

spacediver 3 окт 2013 в 17:37

Это мы с вами «качнули». А Яндексу придется «лицензировать».

macik_spb 3 окт 2013 в 22:21

Полагаю есть книги под свободными лицензиями, или классика не подпадающей под таковые…

Если я Толстого начитаю на диктофон и выложу в сеть с пометкой, что можно мою запись свободно использовать это же не будет нарушением
чьих-то прав?

filldens 22 окт 2013 в 16:10

О технических деталях технологии распознавание речи Яндекс можно почитать здесь: habrahabr.ru/company/yandex/blog/198556/

lightcaster 22 окт 2013 в 16:28

Я написал в той теме ответ. Сейчас я в отпуске, и у меня лирическое настроение, так что не воспринимайте категорично :)

allegator 3 окт 2013 в 10:02

Запилите же, наконец, Яндекс.Торрент! ))

Sleuthhound 3 окт 2013 в 12:22

немного не понял, для распознавания нужно соединение через Инет или не нужно? Если нужно Мнтернет-соединение, то нафига она нужна? Есть Google Speech API, который очень даже неплохо понимает русскую речь и еще 50 с лишним языков.

-6

Sleuthhound 3 окт 2013 в 12:29

Судя по всему распознавание идет в онлайне, отсюда вопрос, а нафига оно нудно если есть Google Speech API?

Или у яндекса не хватило денег на лицензию от Nuance на ядро распознавания в оффлайне?

-5