Pytania otagowane jako speech-processing

1
Czym różni się redukcja szumów w rozpoznawaniu mowy od redukcji szumów, która ma uczynić mowę bardziej „zrozumiałą” dla ludzi?
to pytanie interesuje mnie od dłuższego czasu, głównie dlatego, że sam pracuję nad redukcją szumów dla istniejącego systemu rozpoznawania mowy. Większość artykułów na temat technik redukcji hałasu wydaje się koncentrować na tym, jak uczynić mowę bardziej zrozumiałą dla ludzi lub jak poprawić niejasne warunki, takie jak „jakość mowy”. Jestem pewien, …

3
Jak przejść do wykrywania gwizdów, trzasków i innych dźwięków na wejściach audio na żywo?
Przeczytałem wiele pytań na temat SO i, szczerze mówiąc, każde z nich nie opisuje żadnej konkretnej drogi. Niektórzy mówią „zrób FFT”, a niektórzy mówią „przekroczenie zera” itd. Ale posunąłem się tylko do zrozumienia, że ​​cyfrowe wejście audio składa się z szeregu amplitud dla określonej częstotliwości i dobrze. Naprawdę nie wiem …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.