Witam. Kończe pracę dyplomową magisterską (rozpoznawanie izolowanych słów/komunikatów za pomocą sieci neuronowej zrealizowanej na procesorze DSP (płytka prototypowa na DSK 6416)). Najśmieszniejsze jest to, że wszystko działa. 3 komunikaty są rozpoznawane (Światło, Załącz, Wyłacz). Obsługa AIC i całej reszty gotowa(a to było chyba najgorsze w tym wszystkim). A teraz trzeba to opisać
Działa to tak, że gotowy sygnał (8kHz, 16bit, mono) dzielę na paczki 30ms zachodzące po 10ms. Standardowo okienkowanie, usuwanie wartości średniej. I teraz analiza cepstralna. Chodzi mi o róznicę miedzy cepstrum a współczynikami cepstralnymi. Bo samo cepstrum to może być uzyte do usuwania echa. A licze u siebie współczynniki cepstralne z kazdej paczki (dokładnie 12). Obliczenia metoda nie poprzez liczenie podwójnego FFT tylko przez wyliczenia współczynników filtru dla LPC-10. Nastepnie mam mojego pomysłu procedurę która kompresuje wszystko do 10 paczek po 12 współczynników i to na sieć neuronową
I co mi mówią te współczynniki?? Zauważyłem np, że z przebiegu zmian współczynnika 3 i 5 bodajże można wywnioskowac, czy wypowiedź została wypowiedziana przez kobietę czy meżczyznę ale odbiegam od tematu teraz:P
Działa to tak, że gotowy sygnał (8kHz, 16bit, mono) dzielę na paczki 30ms zachodzące po 10ms. Standardowo okienkowanie, usuwanie wartości średniej. I teraz analiza cepstralna. Chodzi mi o róznicę miedzy cepstrum a współczynikami cepstralnymi. Bo samo cepstrum to może być uzyte do usuwania echa. A licze u siebie współczynniki cepstralne z kazdej paczki (dokładnie 12). Obliczenia metoda nie poprzez liczenie podwójnego FFT tylko przez wyliczenia współczynników filtru dla LPC-10. Nastepnie mam mojego pomysłu procedurę która kompresuje wszystko do 10 paczek po 12 współczynników i to na sieć neuronową
I co mi mówią te współczynniki?? Zauważyłem np, że z przebiegu zmian współczynnika 3 i 5 bodajże można wywnioskowac, czy wypowiedź została wypowiedziana przez kobietę czy meżczyznę ale odbiegam od tematu teraz:P