Pytania otagowane jako speech-recognition

3
filtr zakłóceń mowy ludzkiej
Czy ktoś zna filtr tłumiący brak mowy? Piszę oprogramowanie do rozpoznawania mowy i chciałbym odfiltrować wszystko oprócz ludzkiej mowy. Obejmuje to hałas w tle, hałas wytwarzany przez kiepski mikrofon, a nawet muzykę w tle. Zaimplementowałem już filtr pierwszego rzędu, który kompensuje zsuwanie się widma mocy o 6 dB, ale nadal …

1
Ustalenie, jak podobny jest dźwięk do ludzkiej mowy
Szukając odpowiedzi na ten problem, znalazłem tę tablicę, więc postanowiłem opublikować moje pytanie z przepełnienia stosu. Poszukuję metody określania podobieństwa między segmentem audio a głosem ludzkim, który jest wyrażany liczbowo. Sporo szukałem, ale to, co do tej pory znalazłem (szczegółowo poniżej), nie pasuje do tego, czego potrzebuję: Jedną z metod …

1
Czym różni się redukcja szumów w rozpoznawaniu mowy od redukcji szumów, która ma uczynić mowę bardziej „zrozumiałą” dla ludzi?
to pytanie interesuje mnie od dłuższego czasu, głównie dlatego, że sam pracuję nad redukcją szumów dla istniejącego systemu rozpoznawania mowy. Większość artykułów na temat technik redukcji hałasu wydaje się koncentrować na tym, jak uczynić mowę bardziej zrozumiałą dla ludzi lub jak poprawić niejasne warunki, takie jak „jakość mowy”. Jestem pewien, …

1
Projektowanie wektora cech do rozróżniania różnych przebiegów dźwiękowych
Rozważ 4 następujące sygnały kształtu fali: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 …


2
Jak zaimplementować gradientową transformację Hougha
Próbuję użyć transformacji Hougha do wykrywania krawędzi i chciałbym wykorzystać obrazy gradientowe jako podstawę. Co zrobiłem do tej pory, ze względu na obraz Iwielkości [M,N]i jej pochodnych cząstkowych gx, gyjest obliczenie kąta gradientu w każdym pikselu jako thetas = atan(gy(x,y) ./ gx. Podobnie obliczam wielkość gradientu jako magnitudes = sqrt(gx.^2+gy.^2). …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.