Comments 6
> Типичная величина одного интервала — 25,6 мс
Что за число такое? :) Насколько я знаю, обычно берут окно в 25 мс. Со сдвигом в 10 мс, как у вас и написано.
Что за число такое? :) Насколько я знаю, обычно берут окно в 25 мс. Со сдвигом в 10 мс, как у вас и написано.
0
Поскольку речь является нестационарным процессом, то ее принято анализировать на коротких участках (10 — 30 мс), где спектрально-корреляционные характеристики остаются примерно постоянними. В моем примере значение интервала 25.6 зависит от частоты дискретизации сигнала и его разрядности.
0
Существуют методы времячастотного анализа, которые не предполагают стационарности сигнала на конкретных временных промежутках. Скажем, у вас результат анализа будет зависеть от того, где именно спектр сигнала изменится: на границах блоков или внутри их. Вы не рассматривали такие методы, как Morlet's wavelets? Также я недавно узнал о новом, очень многообещающем методе «Sparse time-frequency representations» (в гугле легко находится). Этот метод позволяет отслеживать как резко, так и плавно меняющиеся спектральные особенности сигнала. Например, единичный импульс (дельта-функция), постоянный тон (синус) и меняющийся тон (синус, частота которого плавно меняется во времени) с помощью этого метода распознаются как тонкие линии на времячастотной плоскости. Такое недостижимо традиционными методами, включая STFT, который вы реализовали, или Wavelet.
0
Вероятно вы имели в виду окно Хэмминга, а не «Геминга»? Следует ещё сказать, что приближение стационарности (10-30мС) и преобразование Фурье (ПФ) используется «по бедности». Так как использование любого другого преобразования приводит к существенному увеличению вычисления вычислительной нагрузки. Хотя, с точки зрения детальности анализа и физики процесса, лучше бы было раскладывать отрезки сигнала не по чистым гармоникам (ПФ), а, например, по двумерному набору затухающих гармоник (в координатах «частота-показатель затухания»). Правда, нужно будет тогда учесть, что тогда преобразование пойдёт не в декартовой системе координат (затухающие гармоники не ортогональны), т.е. возникнет проблема интерпретации результатов и «растекания» энергии (аналогичное явление есть и для дискретного ПФ, когда вы не попадаете точно в частотный отсчёт).
0
Кстати, небольшая ремарка по коду: вместо «C=fft(z,512); C=abs©;» наверное было проще «C=abs(fft(z,512)»?
0
Sign up to leave a comment.
Предварительная обработка речевых сигналов с помощью Matlab