Witam,
Chciałabym napisać program do rozpoznawania mowy, dajmy na to na poczatek cyfr i liczb oparty na sieciach neuronowych. Czytalam, ze efektywniejsze są modele markowa, ale podobno jak na poczatek trudniejsze. Mam dużo próbek dźwięku, jednak słabo się znam na przetwarzaniu sygnałów i zastanawiam się od czego zacząć. Co zrobić, aby wyodrębnić z nich wektory cech? Może znacei jakieś ksiązki godne polecenia dla początkujących? Albo sami coś doradzicie?
Z góry bardzo dziękuję.
Chciałabym napisać program do rozpoznawania mowy, dajmy na to na poczatek cyfr i liczb oparty na sieciach neuronowych. Czytalam, ze efektywniejsze są modele markowa, ale podobno jak na poczatek trudniejsze. Mam dużo próbek dźwięku, jednak słabo się znam na przetwarzaniu sygnałów i zastanawiam się od czego zacząć. Co zrobić, aby wyodrębnić z nich wektory cech? Może znacei jakieś ksiązki godne polecenia dla początkujących? Albo sami coś doradzicie?