Pytania otagowane jako audio

Audio, lub pod względem przetwarzania sygnału, sygnał audio jest analogową lub cyfrową reprezentacją dźwięku, zwykle jako napięcie elektryczne.

6
Co trzeba wiedzieć, aby zbudować syntezator oprogramowania?
Dla kogoś, kto ma pewne doświadczenie w tworzeniu oprogramowania, kocha swoje syntezatory i zna [bardzo] podstawy cyfrowej reprezentacji dźwięku, jakie są pierwsze kroki, które powinien wykonać, aby zaprogramować syntezator muzyczny pod względem DSP?
19 audio 

3
Pokaż innym, jak się słyszę
Sooo .. Myślałem o tym. Wszyscy wiemy, że brzmi inaczej niż to, co słyszymy z własnego głosu. Łatwo jest dowiedzieć się, jak inni nas słyszą, nagrywając się i słuchając. Ale co na odwrót? Czy istnieje sposób na przekształcenie naszego głosu w taki sposób, aby inni mogli nas usłyszeć, gdy postrzegamy …

4
Biblioteki do wykrywania aktywności głosowej (bez rozpoznawania mowy)
W odpowiedzi na moje poprzednie pytanie zastanawiałem się, czy istnieją biblioteki do wykrywania mowy. Przez wykrywanie mowy rozumiem przekazywanie bufora audio i powrót do indeksu, od którego mowa zaczyna się i kończy. Więc jeśli mam 10 sekund próbkowania dźwięku przy 44 kHz, oczekiwałbym szeregu liczb takich jak: 44000 88000 123000 …
18 audio  speech 

3
filtr zakłóceń mowy ludzkiej
Czy ktoś zna filtr tłumiący brak mowy? Piszę oprogramowanie do rozpoznawania mowy i chciałbym odfiltrować wszystko oprócz ludzkiej mowy. Obejmuje to hałas w tle, hałas wytwarzany przez kiepski mikrofon, a nawet muzykę w tle. Zaimplementowałem już filtr pierwszego rzędu, który kompensuje zsuwanie się widma mocy o 6 dB, ale nadal …

1
Znajdź podobną muzykę za pomocą spektrum FFT
Kilka tygodni eksperymentowałem, aby znaleźć sposób na dopasowanie / znalezienie podobnych utworów w bibliotece zawierającej różne gatunki muzyczne. Moja pierwsza próba polegała na wykryciu funkcji takich jak Tempo lub ilości basów w utworach, aby utworzyć grupy, ale nie posunąłem się za daleko z tym podejściem (wykrywanie uderzeń oparte na zmianach …
16 audio  fft  music 

4
Ekstrakcja funkcji do klasyfikacji dźwięku
Próbuję wyodrębnić funkcje z pliku dźwiękowego i sklasyfikować dźwięk jako należący do określonej kategorii (np. Szczekanie psa, silnik pojazdu itp.). Chciałbym wyjaśnić następujące kwestie: 1) Czy to w ogóle wykonalne? Istnieją programy rozpoznające mowę i rozróżniające różne rodzaje szczekania psa. Ale czy można mieć program, który może odbierać próbkę dźwięku …


4
Niższe częstotliwości silniejsze w FFT?
Obliczam FFT z wejścia mikrofonu. Zauważam, że niższe częstotliwości zawsze wydają się mieć większą moc (wyższe dB) niż wyższe częstotliwości. Tnę dane na ramki 24576 bajtów (4096 * 6). Zastosuj okno Hamminga: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Uruchom go przez FFTW Process1D(). Konwertuj z liczb zespolonych: output[i] = 10.0 …
15 audio  fft 

1
Zwiększenie głośności ścieżki dzięki RMS
Próbuję obliczyć głośność ścieżki dźwiękowej, którą zapisałem w buforze. Bufor zawiera dane PCM sygnału i chcę dowiedzieć się, jak „głośno” jest za pomocą Root Mean Squared. Zakładam, że mogę to zrobić w dziedzinie czasu zamiast przełączać się na dziedzinę częstotliwości. Jaki byłby na to pseudo-kod? Czy po prostu próbowałem przez …

2
Kiedy zaczyna się utwór śmiechu?
Jeden z moich weekendowych projektów wprowadził mnie w głębokie wody przetwarzania sygnałów. Podobnie jak w przypadku wszystkich moich projektów kodu, które wymagają trochę matematyki, cieszę się, że majsterkuję, aby znaleźć rozwiązanie pomimo braku teoretycznego uziemienia, ale w tym przypadku nie mam żadnego i chętnie poradzę na mój problem , a …

4
Najbardziej efektywny sposób wydobywania w czasie rzeczywistym komponentów częstotliwości sygnału audio z dokładnością zbliżoną do ludzkiej
Próbuję dowiedzieć się, w jaki sposób (jeśli to możliwe) wyodrębnić komponenty częstotliwości arbitralnej próbki audio (zazwyczaj muzyki) w sposób podobny do FFT, ale w swoich badaniach nad algorytmem FFT dowiaduję się, że cierpi on na pewne surowe ograniczenia w tym celu. Istnieją 3 problemy, które przedstawia FFT: Ponieważ rozdzielczość bin …

4
Scipy - Przetwarzanie audio
Szukam dobrych narzędzi do przetwarzania sygnału audio. np. analiza mowy i muzyki, automatyczna identyfikacja języka itp. Czy biblioteka Scipy zapewnia funkcje przetwarzania dźwięku? Czy ma dobre narzędzie do przetwarzania sygnału audio? Czy możesz zasugerować do tego narzędzie?

2
Jaki projekt filtra pasmowoprzepustowego da najkrótszą odpowiedź impulsową?
Zaprojektowanie prostego filtru pasmowego IIR II rzędu z filtrem Buterwortha o częstotliwości środkowej 500 Hz i szerokości pasma 1 oktawy daje mi następujące pasmo przenoszenia ... Teraz, jeśli wezmę odpowiedź impulsową i znormalizuję ją i przekonwertuję na dB, możemy zaobserwować zanik odpowiedzi impulsowej. Zanik reakcji impulsowej jest w przybliżeniu liniowy …

5
Określ, gdzie zaczyna się śpiewanie w nagraniu głosowym
Mam małą aplikację w stylu karaoke, w której użytkownik śpiewa 4 wiersze piosenki, z jedną sekundą przerwy między nimi. Nie ma podkładu muzycznego, więc jest to tylko głos, miejmy nadzieję, że problem będzie łatwiejszy do rozwiązania. Szukam najbardziej niezawodnego sposobu na dokładne wykrycie, gdzie w moim nagraniu użytkownik rozpoczyna i …

1
Oszacowanie czasu rozpoczęcia wybuchu tonu w hałasie?
Jakich technik można użyć do oszacowania czasu rozpoczęcia wybuchu sinusoidalnego tonu w głośnym sygnale? Załóżmy, że impuls tonowy ma znaną stałą częstotliwość (ale nieznaną fazę) i bardzo ostry czas narastania, a celem jest oszacowanie czasu rozpoczęcia w czasie lepszym niż połowa czasu narastania i / lub jednego okresu częstotliwości tonu …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.