Pytania otagowane jako speech

4
Biblioteki do wykrywania aktywności głosowej (bez rozpoznawania mowy)
W odpowiedzi na moje poprzednie pytanie zastanawiałem się, czy istnieją biblioteki do wykrywania mowy. Przez wykrywanie mowy rozumiem przekazywanie bufora audio i powrót do indeksu, od którego mowa zaczyna się i kończy. Więc jeśli mam 10 sekund próbkowania dźwięku przy 44 kHz, oczekiwałbym szeregu liczb takich jak: 44000 88000 123000 …
18 audio  speech 

2
Kiedy powinienem obliczyć PSD zamiast zwykłego widma wielkości FFT?
Mam trzydziestosekundowy sygnał mowy, który był próbkowany z częstotliwością 44,1 kHz. Teraz chciałbym pokazać, jakie częstotliwości ma mowa. Nie jestem jednak pewien, jaki byłby to najlepszy sposób. Wydaje się, że czasami oblicza się wartość bezwzględną transformaty Fouriera, a czasem gęstość widmową mocy. Jeśli dobrze rozumiem, to drugie działa tak, że …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.