Pull to refresh

Comments 9

Так понимаю распознавать буквы это не большая проблема? Если в качестве выходного блока можно запускать программы, то можно сделать простую систему голосового управления.
Ну распознавание речи делается явно не по спектру, а скорее свёрткой с известными паттернами и выявлением наиболее подходящего.

Здесь была идея предложить лично оценить спектр излучаемых человеком звуков, а так же изучить пакет GNU Radio на базе этих данных.

Хотя можно дописать блок распознавания одного из слов из списка. Думаю, в базовом варианте даже корреляция справится с выделением наиболее похожего.
Я имел ввиду еще более простой вариант, распознавать отдельные буквы.
Вообще буквы это распознанные мозгом фонемы как таковых букв в устной речи нет, тут вопрос упирается в частотную девиацию основного тона от носителя к носителю, выразительности артикуляции и наличия частотного словаря фонем + правила фонетики для подстановки букв при уверенном распознавании фонемы ну и словарь желательно чтобы проверять орфографию тоже автоматически. И это желательно сделать для многих тонов и темпов речи
Ну это всё актуально если мы в студии и не нужно фильтровать шум, второго собеседника, фоновую музыку, чьё-то пение и проезжающий рядом автомобиль.
Та же самая Siri, как она не проста в использовании тем не менее потребовалось более 40 лет и работы нескольких институтов + вложения в несколько миллиардов долларов чтобы получить коммерчески значимый результат.
Попробуйте записать любое слово несколько раз, а за тем найдите зоны корреляции в двоичном файле (плавающим окном) или в Фурье образе будет много разочарований… ах да, то что записано ещё раз можно в записи найти и посмотреть подстрочную расшифровку, но нам нужна как раз машинная расшифровка, а не специально обученные люди )))
IoT и GNU radio, хороший подход. Однако шифровать будут, ко времени привязываться, и много чего еще, но после такого IoT будет больше похож на вымершие LXBOX, чем на компактные устройства.
Именно про шифрование и пойдёт речь, когда будет показано подручными средствами, что большинство устройств от китайской розетки до почти родного nooLite не имеют шифрования, а значит управляющие команды для них очень легко можно подделывать в эфире.

Сейчас ни один протокол, претендующий на звание технологии переднего фронта IoT, не может обойтись без шифрования. Например, в Z-Wave оно уже давно есть (лет 9 точно), но производители откровенно ленятся его внедрять. Z-Wave Альянс это понял, и новая версия (называется S2) будет иметь peer-to-peer шифрование на уровне протокола. Т.е. сразу, по умолчанию, да ещё и без общего сетевого ключа, как было в прошлой версии.

Аналогично и к контроллерам начинают предъявлять более строгие требования по безопасности. Взломать контроллер всегда интересней — одно место управления сразу всем.
del

опять не в ту ветку… глючное приложение TM при ответе на последний коммент отвечает на предпоследний…
В спектре хлопка каких-только гармоник нет, это же короткий импульс, а-ля дельта функция))))
кажется, я об этом и писал ;)
Sign up to leave a comment.