Pytania otagowane jako mfcc

2
Jak interpretować krok DCT w procesie ekstrakcji MFCC?
W większości zadań przetwarzania audio jedną z najczęściej używanych transformacji jest MFCC (współczynniki cepstralne częstotliwości Mel) . Wiem głównie matematykę stojącą za MFCC: rozumiem zarówno krok banku filtrów, jak i skalowanie częstotliwości Mel. Czego nie dostaję to krok DCT (Discrete Cosine Transform): Jakie informacje otrzymuję w tym kroku? Jaka jest …


4
Ekstrakcja funkcji do klasyfikacji dźwięku
Próbuję wyodrębnić funkcje z pliku dźwiękowego i sklasyfikować dźwięk jako należący do określonej kategorii (np. Szczekanie psa, silnik pojazdu itp.). Chciałbym wyjaśnić następujące kwestie: 1) Czy to w ogóle wykonalne? Istnieją programy rozpoznające mowę i rozróżniające różne rodzaje szczekania psa. Ale czy można mieć program, który może odbierać próbkę dźwięku …

1
Średnia normalizacja cepstralna
Czy ktoś może wyjaśnić normalizację cepstralną, jak wpływa na to właściwość równoważności splotu? Czy należy wykonywać CMN w rozpoznawaniu głośników na podstawie MFCC? Dlaczego właściwość splotu jest podstawową potrzebą MFCC? Jestem bardzo nowy w tym przetwarzaniu sygnału. Proszę pomóż
15 mfcc 

3
Czy to poprawna interpretacja kroku DCT w obliczeniach MFCC?
To kontynuacja dyskusji tutaj . Chciałbym tam skomentować, ale nie mam 50 powtórzeń, więc zadaję nowe pytanie. Oto, w jaki sposób rozumiem krok DCT w procesie obliczania MFCC: Uzasadnieniem tego jest oddzielenie korelacji w logarytmicznych wielkościach widmowych (od banku filtrów) z powodu nakładania się filtrów. Zasadniczo DCT wygładza reprezentację widma …
9 mfcc  dct 
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.