Przetwarzanie sygnałów audio

6

Co trzeba wiedzieć, aby zbudować syntezator oprogramowania?

Dla kogoś, kto ma pewne doświadczenie w tworzeniu oprogramowania, kocha swoje syntezatory i zna [bardzo] podstawy cyfrowej reprezentacji dźwięku, jakie są pierwsze kroki, które powinien wykonać, aby zaprogramować syntezator muzyczny pod względem DSP?

19 audio

3

Pokaż innym, jak się słyszę

Sooo .. Myślałem o tym. Wszyscy wiemy, że brzmi inaczej niż to, co słyszymy z własnego głosu. Łatwo jest dowiedzieć się, jak inni nas słyszą, nagrywając się i słuchając. Ale co na odwrót? Czy istnieje sposób na przekształcenie naszego głosu w taki sposób, aby inni mogli nas usłyszeć, gdy postrzegamy …

18 signal-analysis audio transform

4

Biblioteki do wykrywania aktywności głosowej (bez rozpoznawania mowy)

W odpowiedzi na moje poprzednie pytanie zastanawiałem się, czy istnieją biblioteki do wykrywania mowy. Przez wykrywanie mowy rozumiem przekazywanie bufora audio i powrót do indeksu, od którego mowa zaczyna się i kończy. Więc jeśli mam 10 sekund próbkowania dźwięku przy 44 kHz, oczekiwałbym szeregu liczb takich jak: 44000 88000 123000 …

18 audio speech

3

filtr zakłóceń mowy ludzkiej

Czy ktoś zna filtr tłumiący brak mowy? Piszę oprogramowanie do rozpoznawania mowy i chciałbym odfiltrować wszystko oprócz ludzkiej mowy. Obejmuje to hałas w tle, hałas wytwarzany przez kiepski mikrofon, a nawet muzykę w tle. Zaimplementowałem już filtr pierwszego rzędu, który kompensuje zsuwanie się widma mocy o 6 dB, ale nadal …

17 filters audio noise speech-recognition

1

Znajdź podobną muzykę za pomocą spektrum FFT

Kilka tygodni eksperymentowałem, aby znaleźć sposób na dopasowanie / znalezienie podobnych utworów w bibliotece zawierającej różne gatunki muzyczne. Moja pierwsza próba polegała na wykryciu funkcji takich jak Tempo lub ilości basów w utworach, aby utworzyć grupy, ale nie posunąłem się za daleko z tym podejściem (wykrywanie uderzeń oparte na zmianach …

16 audio fft music

4

Ekstrakcja funkcji do klasyfikacji dźwięku

Próbuję wyodrębnić funkcje z pliku dźwiękowego i sklasyfikować dźwięk jako należący do określonej kategorii (np. Szczekanie psa, silnik pojazdu itp.). Chciałbym wyjaśnić następujące kwestie: 1) Czy to w ogóle wykonalne? Istnieją programy rozpoznające mowę i rozróżniające różne rodzaje szczekania psa. Ale czy można mieć program, który może odbierać próbkę dźwięku …

16 audio mfcc machine-learning classification sound-recognition

2

Jak wydobyć część wokalną z stereofonicznego sygnału audio?

Teraz przetwarzam plik MP3 i napotkałem ten problem. Moje MP3 jest zakodowane stereo. Chcę wyodrębnić partię wokalną do dalszego przetwarzania (niezależnie od trybu sygnałów wyjściowych, mono lub stereo). O ile mi wiadomo, audio jest zakodowane w różnych pasmach sub-dis-joint w MP3. Myślę, że mogę ograniczyć sygnały do zakresu głosu poprzez …

15 audio downsampling mp3 background-subtraction

4

Niższe częstotliwości silniejsze w FFT?

Obliczam FFT z wejścia mikrofonu. Zauważam, że niższe częstotliwości zawsze wydają się mieć większą moc (wyższe dB) niż wyższe częstotliwości. Tnę dane na ramki 24576 bajtów (4096 * 6). Zastosuj okno Hamminga: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Uruchom go przez FFTW Process1D(). Konwertuj z liczb zespolonych: output[i] = 10.0 …

15 audio fft

1

Zwiększenie głośności ścieżki dzięki RMS

Próbuję obliczyć głośność ścieżki dźwiękowej, którą zapisałem w buforze. Bufor zawiera dane PCM sygnału i chcę dowiedzieć się, jak „głośno” jest za pomocą Root Mean Squared. Zakładam, że mogę to zrobić w dziedzinie czasu zamiast przełączać się na dziedzinę częstotliwości. Jaki byłby na to pseudo-kod? Czy po prostu próbowałem przez …

15 audio discrete-signals

2

Kiedy zaczyna się utwór śmiechu?

Jeden z moich weekendowych projektów wprowadził mnie w głębokie wody przetwarzania sygnałów. Podobnie jak w przypadku wszystkich moich projektów kodu, które wymagają trochę matematyki, cieszę się, że majsterkuję, aby znaleźć rozwiązanie pomimo braku teoretycznego uziemienia, ale w tym przypadku nie mam żadnego i chętnie poradzę na mój problem , a …

14 audio sound-recognition

4

Najbardziej efektywny sposób wydobywania w czasie rzeczywistym komponentów częstotliwości sygnału audio z dokładnością zbliżoną do ludzkiej

Próbuję dowiedzieć się, w jaki sposób (jeśli to możliwe) wyodrębnić komponenty częstotliwości arbitralnej próbki audio (zazwyczaj muzyki) w sposób podobny do FFT, ale w swoich badaniach nad algorytmem FFT dowiaduję się, że cierpi on na pewne surowe ograniczenia w tym celu. Istnieją 3 problemy, które przedstawia FFT: Ponieważ rozdzielczość bin …

14 fft audio frequency music real-time

4

Scipy - Przetwarzanie audio

Szukam dobrych narzędzi do przetwarzania sygnału audio. np. analiza mowy i muzyki, automatyczna identyfikacja języka itp. Czy biblioteka Scipy zapewnia funkcje przetwarzania dźwięku? Czy ma dobre narzędzie do przetwarzania sygnału audio? Czy możesz zasugerować do tego narzędzie?

14 audio python signal-detection

2

Jaki projekt filtra pasmowoprzepustowego da najkrótszą odpowiedź impulsową?

Zaprojektowanie prostego filtru pasmowego IIR II rzędu z filtrem Buterwortha o częstotliwości środkowej 500 Hz i szerokości pasma 1 oktawy daje mi następujące pasmo przenoszenia ... Teraz, jeśli wezmę odpowiedź impulsową i znormalizuję ją i przekonwertuję na dB, możemy zaobserwować zanik odpowiedzi impulsowej. Zanik reakcji impulsowej jest w przybliżeniu liniowy …

14 filters audio infinite-impulse-response impulse-response bandpass

5

Określ, gdzie zaczyna się śpiewanie w nagraniu głosowym

Mam małą aplikację w stylu karaoke, w której użytkownik śpiewa 4 wiersze piosenki, z jedną sekundą przerwy między nimi. Nie ma podkładu muzycznego, więc jest to tylko głos, miejmy nadzieję, że problem będzie łatwiejszy do rozwiązania. Szukam najbardziej niezawodnego sposobu na dokładne wykrycie, gdzie w moim nagraniu użytkownik rozpoczyna i …

14 audio signal-detection

1

Oszacowanie czasu rozpoczęcia wybuchu tonu w hałasie?

Jakich technik można użyć do oszacowania czasu rozpoczęcia wybuchu sinusoidalnego tonu w głośnym sygnale? Załóżmy, że impuls tonowy ma znaną stałą częstotliwość (ale nieznaną fazę) i bardzo ostry czas narastania, a celem jest oszacowanie czasu rozpoczęcia w czasie lepszym niż połowa czasu narastania i / lub jednego okresu częstotliwości tonu …

14 audio algorithms edge-detection

Pytania otagowane jako audio