4
Jaka jest różnica między transformatą Fouriera a transformacją cosinus?
W rozpoznawaniu mowy interfejs użytkownika zazwyczaj przetwarza sygnał, aby umożliwić ekstrakcję funkcji ze strumienia audio. W tym procesie dwukrotnie stosowana jest dyskretna transformata Fouriera (DFT). Pierwszy raz jest po okienkowaniu; po zastosowaniu binowania Mel, a następnie kolejnej transformacji Fouriera. Zauważyłem jednak, że w rozpoznawaniu mowy (na przykład domyślnym interfejsie CMU …