Как стать автором
Обновить

Комментарии 28

Ну вот, заглянул, а алгоритмов нет. Жаль.

Кстати, а у Сири качество распознавания лучше гуглового?
там нюанса же движок. Сири, это распознавание от nuance, а контекст уже от siri / apple. Ответы от bing, google, wolfram alpha,…
А, тогда понятно. У nuance сильная система.
На самом деле не совсем понятно, известно что Nuance и Apple сотрудничали и речь возможно даже шла об лицензировании каких-то патентов, так что вероятнее там какой-то гибридный движек.
Может быть. Я был удивлен когда узнал о Siri. Не вопросно-ответной системой. С ней как раз понятно — трансляция в поисковые движки и вольфрам альфу. Просто, система распознавания — довольно сложная штука. Внезапно и неизчего такие системы не появляются.
Siri понимает меня лучше, чем Гугл на LG p990.
С Гуглом я не мог без ошибок надиктовать трёх слов, а с Siri я могу надиктовывать смс слов в десять.
Говорю я отнюдь не идеально, мой русский акцент слышен за версту.
У меня получается перечатать гугловским голосовым вводом, но нужно очень четко проговаривать, а часто это лень. Я оправдываю его тем, что это еще бета))
Еще это сильно зависит от качества микрофоно, но распознавание Гуглом уже заметно улучшилось, раньше половину слов не понимал, а теперь большинство понимает, хоть тоже произношение не идеал.
Плюс недавно появилась возможность персонально подстраиваться под владельца, что должно улучшить поиск.
По-моему, статья ни о чем.
И опять Apple создала культ. Теперь ждем заголовки: «Блаблабла — убийца Siri», или что-то в таком духе.
Бери шире, будут орать о патентах, «мол запатентовали какой-то движок распознования речи. Аппл еще бы колесо запатентовали!!!111!».
Ждем с распростертыми объятиями. Apple сделала отличную вещь, двинув технологию в массы. Процесс пошел, через какое-то время, телефон с распознаванием речи будет самим собой разумеющимся, и если у кого-то этого не будет — он просто проиграет конкуренцию. В результате мы, как потребители, только выиграем. «Убийцы» только привлекут внимания к теме, что зэр гут.
НЛО прилетело и опубликовало эту надпись здесь
Есть какое-то нехорошее предчувствие, что любое осмысленное применение распознавания голоса уже кем то запатентовано… Обычно все это патентуется до того, как придут реальные технологии.
Оруэлл о таком и не мечтал. Мало того, что анализируя поисковой запрос, Большой Брат знает что Петя захотел увеличить себе член, так теперь ББ всегда с тобой и можно с ним поговорить по душам =)

В DeuxEx 2 был автомат NG Resonance с которым нужно было поболтать, так вот он ещё и стучал спецслужбам об услышанном. Думается что это почти уже реальность.

Шаг №2 — добавить в Siri список друзей. Тогда он/а/о будет аккумулировать инфу определённого круга.
Например.
Вася «Siri, видел по пути на работу Петю. Что-то он не радостный»
Siri «Скажу по секрету, Петя вчера провёл 35минут в поисках вакуумного удлинителя члена но на прошлой неделе он пропил остатки зарплаты в баре „Голубая луна“
Только поклянись что никому не расскажешь»
Вася «Мамой клянусь»
Siri «Ok»
>Windows Speech Recognition и голосовые команды OS X были интересными, но недостаточно точными и удобными

Пусть тут полежит
НЛО прилетело и опубликовало эту надпись здесь
Интересно, а программы распознавания музыки (типа shazam) работают по сходному принципу?
Скорее всего. Может, конечно, есть какие-нибудь новые Секретные Наработки в этом деле, но научный state of the art распознавания звуковых последовательностей — это работа со скрытыми цепями Маркова (кстати, методика появилась давно, вопрос был только в обучении на больших базах для точности). Ничего специального именно про распознавание музыки, вроде, нет.
Нет, системы распознавания музыки используют acoustic fingerprints.
То есть вы считаете, что марковские модели не попадают под акустические отпечатки? Прежде чем давать ссылку на то, что любой может найти за минуту, стоит все-таки подумать.
По крайней мере в статье ссылок на них не заметил. М.б. тогда пруфлинк?
На что пруфлинк? На то, что при распознавании речи используется вся перечисленная в acoustic fingerprints информация и дальше уже статистический аппарат вроде HMM? Вы так говорите, как будто сами написали уникальные чудо-признаки поиска музыка, на википедии просто общие слова «often exploited by audio fingerprintsю...»
Смеюсь — аж слёзы из глаз. Крепкие нервы у парня. :)
«Эта база использовалась другими системами еще на протяжении двадцати лет»


Закономерный вопрос, а что использовалось в последние десять лет?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Изменить настройки темы

Истории