logo elektroda
logo elektroda
X
logo elektroda
Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

identyfikacji uzytkownika na podstawie jego glosu

mieszkoww 11 Kwi 2009 16:58 1341 4
  • #1 6402162
    mieszkoww
    Poziom 2  
    Witam
    Mam do napisania program, który będzie identyfikował użytkownika na podstawie jego głosu. Nie wiem jak się zwiąść za ten projekt może ktoś mi podpowie jak się za to zabrać od prowadzącego zajęcia dowiedziałem się tylko że muszę analizować sygnał mowy zarówno w dziedzinie czasu jak i częstotliwości wyszukiwać jakieś wzorce itp. Czy mógłby mi ktoś pomoc z ta analiza w czasie i częstotliwości tzn co mam analizować i co szukać charakterystycznego w tym sygnale z góry dzięki za pomoc.
  • #2 6402692
    Zbych_
    Poziom 25  
    Jeśli użytkownik ma wypowiadać tylko jedno słowo-hasło, to wydaje mi się, że możesz zacząć od analizy spektogramu i sprawdzania korelacji dwóch spektrogramów (wzorcowego i badanego), albo wyszukiwania cech charakterystycznych (kształtu spektrogramu).
    Na początek zacznij od wpisania w google odpowiedniego hasła i przeczytania materiałów, które wyskoczą np. Link
  • #3 6403018
    And!
    Admin grupy Projektowanie
    Do ekstrakcji cech mówcy:
    LPC lub Mel-cepstrum
    Do porównywania z wzorcem:
    Sieć neuronowa
    Odległość Euklidesowa z Wagami.

    To dosć złożone zagadnienie, uzyskanie 70% skuteczności będzie dobrym wynikiem.
  • #4 6444789
    shg
    Poziom 35  
    Trudny temat, bo poprawne rozróżnienie podobnych głosów wymaga analizy dość subtelnych zależności.
    Chyba najodpowiedniejszym aparatem jest LPC, w którym posługujesz się modelem traktu głosowego. Interesujące dla Ciebie będą informacje o obwiedni widma i jej zmiany w czasie. Obwiednia stanowi odwzorowanie kształtu traktu głosowego w trakcie wypowiadania głosek, czyli ułożenie języka, szczęki, no i każdy człowiek ma jednak nieco inne wymiary. Zmiany obwiedni w czasie związane są ze sposobem wypowiadania poszczególnych głosek. Ponadto zmiany obwiedni należało by śledzić łącznie ze zmianami "tonalnymi". W wymowie niestarannej głoski dźwięczne zachodzą na bezdźwięczne (a właściwie to struny głosowe pracują dłużej / krócej, czy też "uruchamiane" są zbyt późno / wcześnie niż powinny), u każdego w inny, charakterystyczny, sposób. Takie na przykład dźwięczne "h"/"ch" w "humor", czy "dach domu".
  • #5 6447377
    And!
    Admin grupy Projektowanie
    LPC szybko się liczy, natomiast osobiście wolę MelCepstra jeżeli chodzi o jakość ekstrachowanych cech.
    Może to jednak wynikać z charakterystyki ocenianego przezemnie zbioru.
    Z pewnych prób wynikło również że słowa z dużą ilością głosek dźwięcznych (w szczególności "a") dobrze nadają się do identyfikacji mówcy.
REKLAMA