Developers_Relations Oct 30 2015 at 13:02

Зачем голосовому Поиску Google нейронные сети?

5 min

31K

Google Developers corporate blogSearch engines*Client optimization*Machine learning*

Translation

+34

Comments 15

Methos Oct 30 2015 at 14:25

Я почему то не наблюдаю голосовой набор комментариев в том же Instagram или Twitter, а ведь как было бы удобно.

-6

Shirixae Oct 30 2015 at 14:49

А где в посте написано «Мы добавили голосовой ввод в чужие приложения: Instargam и Twitter»? Диктовка с кнопки «микрофон» на клавиатуре там есть и работает. Как только авторы приложений сделают версию, которая будет взаимодействовать с Google Now на таком уровне — появятся и названные вами фичи. К Google-то какие претензии?

Methos Oct 30 2015 at 17:36

В самом же гугле, в их сервисе — нет голосового ввода комментариев, например, в том же g+ или ещё где. А ведь как было бы удобно =))

ivansun69 Oct 30 2015 at 15:16

Тут еще важный вопрос прав на возможность использования технологии. Можно обратиться к более простому примеру, вроде snapchat, которым оказалось выгоднее купить технологический патент looksery вместе с технологией, штатом и продуктом. Так вот, когда гиганты решат, что им это необходимо — начнут именно с покупок интеллектуальной собственности.

Musia17 Oct 30 2015 at 15:42

Давно хотела узнать как все это — вокруг распознавания речи — работает… Правда прочтя статью погрустнела т.к. поняла лишь с пятого на десятое. Но спасибо — буду перечитывать еще :)

xenohunter Oct 30 2015 at 19:03

Попробуйте начать с азов: karpathy.github.io/neuralnets.

Musia17 Oct 30 2015 at 19:07

Спасибо, я знаю что такое нейронные сети, даже какие-то регуляторы на них писала :)

xenohunter Oct 31 2015 at 16:47

Тогда приношу извинения, из комментария понял иначе.

ankh1989 Oct 31 2015 at 07:04

Оч крутая статья. Давно хотел разобраться в этих RNN.

ankh1989 Oct 31 2015 at 06:35

А в этой статье ничего вообщем то и не написано: так, упомянуты лишь кое какие термины без объяснения как же это работает.

afrokick Oct 31 2015 at 02:18

Вот бы еще API для распознавания речи помимо Android…

Sleuthhound Nov 1 2015 at 14:41

Присоединяюсь, очень бы хотелось API под Windows или Linux для оффлайн распознавания, пусть даже за вменяемые деньги.

MoTaJiKa Dec 26 2015 at 03:08

«В процессе обучения RNN мы подмешивали искусственные шумы, ревербацию, эхо и прочие типичные в повседневной эксплуатации «загрязнения» на обучающих сэмплах, что помогло сделать систему распознавания более устойчивым к фоновым шумам. „

И каким же образом это “что» «помогло сделать систему » обученную на шумах, которая в свою очередь будет нормально работать на чистом сигнале без шума без переобучения моделей на чистой речи?

Ведь (пере)обучение НС моделей занимает приличное время в распознавании речи. Не ясно, что именно при использовании RNN послужило благоприятно при распознавании зашумленной речи?

MoTaJiKa Dec 26 2015 at 03:20

«Попробуйте сказать вслух — «museum». Слово выходит моментально, на одном выдохе, и RNN могут это распознать. »

— и какой объём словаря (сколько слов использовалось для обучения и тестирования) такие модели способны таким способом распознать?

onthefly Feb 11 2016 at 01:52

По доброй традиции хаба «Клиентская оптимизация» поинтересуюсь:
— автор, вам известно значение термина, давшего название упомянутому хабу?
— какое отношение этот топик имеет к предметной области, описываемой этим термином?