logo elektroda
logo elektroda
X
logo elektroda
REKLAMA
REKLAMA
Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Preprocessing rozpoznawania mowy

meverone 23 Gru 2010 18:50 1959 10
REKLAMA
  • #1 8905363
    meverone
    Poziom 10  
    Witam,

    Mam zaprojektować Preprocessing sygnału do rozpoznawania mowy, ale nie wiem jak mam się do tego zabrać, mianowicie na aktualna chwile wygooglowałem, że muszę użyć: preemfazy, filtra dolnoprzepustowego oraz, że trzeba dobrać odpowiednia częstotliwość próbkowania (8kHz ?). Byłbym wdzięczny za jakieś materiały, bądź schemat, co jak po kolei...
  • REKLAMA
  • #2 8907864
    Elektronik9
    Poziom 30  
    Jeżeli w nadajniku używasz preemfazy, to w odbiorniku musisz użyć deemfazy żeby nie zmienić sygnału.
  • REKLAMA
  • #3 8908007
    meverone
    Poziom 10  
    To ma być bardziej zaprogramowane w matlabie / octave. Tzn mam 3 pliki *.wav i mam je przygotować do rozpoznawania mowy
  • #4 8908042
    Elektronik9
    Poziom 30  
    Mowa ma pasmo 300-3400Hz więc musisz przepuścić te sygnały przez filtr pasmowoprzepustowy o takim pasmie.
  • #5 8915117
    maciej747
    Poziom 12  
    meverone napisał:
    Mam zaprojektować Preprocessing sygnału do rozpoznawania mowy, ale nie wiem jak mam się do tego zabrać, mianowicie na aktualna chwile wygooglowałem, że muszę użyć: preemfazy, filtra dolnoprzepustowego oraz, że trzeba dobrać odpowiednia częstotliwość próbkowania (8kHz ?). Byłbym wdzięczny za jakieś materiały, bądź schemat, co jak po kolei...


    meverone: jesli dobrze pamiętam, to ważnym elementem preprocessingu było usunięcie ciszy na początku i na końcu sygnału. Być może masz już tą ciszę wyciętą, i w pliku jest od razu użyteczny sygnal do obróbki. W przeciwnym wypadku pogooglaj w tej sprawie. Wbrew pozorom to nie jest takie proste i nie sprowadza się do braku sygnału. Jak nic nie wygooglasz, to spróbuję sobie przypomnieć, o co tam chodziło.

    Pozdro,

    Maciej
  • #6 8918638
    meverone
    Poziom 10  
    Powiedzmy .wav ma już wyciętą cisze albo amplituda jest bliska 0.
    Dodatkowo po przejrzeniu książki Tadeusiewicza jestem już na 100% pewien, że powinien użyć preemfazy na sygnale. No i wygooglowałem, że powinienem uważać na antyaliasing. Resztę się dowiem jak będzie otwarta biblioteka uczelniana, bo w google tak skąpo to wszystko opisane.

    BTW. Dodam, że raczej super skomplikowanych rzeczy nie powinno być, bo jestem po podstawach teorii sygnałów.
  • REKLAMA
  • #7 8949180
    sq9cwd
    Poziom 27  
    Daj znać co i jak, sam jestem ciekaw.
    Pozdrawiam.
  • REKLAMA
  • #8 8951051
    _Robak_
    Poziom 33  
    A ty chcesz rozpoznawać wcześniej zapisany wzorzec mowy z pobranym, czy robić uniwersalne wzorce? Jeśli tak to może nie być tak łatwo:)
  • #9 8951117
    meverone
    Poziom 10  
    Hmmm mam zrobić preprocessing sygnału do rozpoznawania mowy i tyle.
    Ogólnie już trochę bardziej się oczytałem, także w ciągu 2 tygodni powinien przestawić swoje "wypociny".
  • #10 9069163
    Flinta
    Poziom 11  
    No i jak tam sytuacja wygląda. Wyszło Ci cos bo jestem też zainteresowana tym tematem:)
  • #11 9070240
    meverone
    Poziom 10  
    W sumie coś tam mi wyszło, ale projekt nie został sprawdzony, także nie wiem czy to poprawnie działa (chodzi o sam preprocessing). Ogólnie skierowałem się bardziej ku wyznaczeniu współczynników MFCC.
REKLAMA