Witam,
Napisałem program, który wykonuje krótkoterminową FFT z sygnału audio mowy (całkowity sygnał dzielony jest na ramki, każdą ramkę mnożę prze okno Hamminga i ostatecznie wykonuję na niej FFT).
Sygnał w dziedzinie czasu, to sygnał audio 16-bit/44.1kHz/mono, więc poziomów kwantyzacji jest od -32768 do 32768. Te poziomy normalizuję do przedziału -1/1, więc jestem pewien, że maksymalna wartość próbki jaka może wystąpić, to -1 bądź 1.
Moje pytanie natomiast brzmi w jaki sposób określić maksymalną możliwą amplitudę prążka widma powstałego z przekształcenia tego sygnału (program generuje wykres dla widm uzyskanych z ramek i chciałbym móc na stałe określić zakres na osi y)? Wątpię, żeby nie dało się tego określić... sęk w tym, że nie wiem w jaki sposób.
Pozdrawiam!
Napisałem program, który wykonuje krótkoterminową FFT z sygnału audio mowy (całkowity sygnał dzielony jest na ramki, każdą ramkę mnożę prze okno Hamminga i ostatecznie wykonuję na niej FFT).
Sygnał w dziedzinie czasu, to sygnał audio 16-bit/44.1kHz/mono, więc poziomów kwantyzacji jest od -32768 do 32768. Te poziomy normalizuję do przedziału -1/1, więc jestem pewien, że maksymalna wartość próbki jaka może wystąpić, to -1 bądź 1.
Moje pytanie natomiast brzmi w jaki sposób określić maksymalną możliwą amplitudę prążka widma powstałego z przekształcenia tego sygnału (program generuje wykres dla widm uzyskanych z ramek i chciałbym móc na stałe określić zakres na osi y)? Wątpię, żeby nie dało się tego określić... sęk w tym, że nie wiem w jaki sposób.
Pozdrawiam!