Dla kogoś, kto ma pewne doświadczenie w tworzeniu oprogramowania, kocha swoje syntezatory i zna [bardzo] podstawy cyfrowej reprezentacji dźwięku, jakie są pierwsze kroki, które powinien wykonać, aby zaprogramować syntezator muzyczny pod względem DSP?
Sooo .. Myślałem o tym. Wszyscy wiemy, że brzmi inaczej niż to, co słyszymy z własnego głosu. Łatwo jest dowiedzieć się, jak inni nas słyszą, nagrywając się i słuchając. Ale co na odwrót? Czy istnieje sposób na przekształcenie naszego głosu w taki sposób, aby inni mogli nas usłyszeć, gdy postrzegamy …
W odpowiedzi na moje poprzednie pytanie zastanawiałem się, czy istnieją biblioteki do wykrywania mowy. Przez wykrywanie mowy rozumiem przekazywanie bufora audio i powrót do indeksu, od którego mowa zaczyna się i kończy. Więc jeśli mam 10 sekund próbkowania dźwięku przy 44 kHz, oczekiwałbym szeregu liczb takich jak: 44000 88000 123000 …
Czy ktoś zna filtr tłumiący brak mowy? Piszę oprogramowanie do rozpoznawania mowy i chciałbym odfiltrować wszystko oprócz ludzkiej mowy. Obejmuje to hałas w tle, hałas wytwarzany przez kiepski mikrofon, a nawet muzykę w tle. Zaimplementowałem już filtr pierwszego rzędu, który kompensuje zsuwanie się widma mocy o 6 dB, ale nadal …
Kilka tygodni eksperymentowałem, aby znaleźć sposób na dopasowanie / znalezienie podobnych utworów w bibliotece zawierającej różne gatunki muzyczne. Moja pierwsza próba polegała na wykryciu funkcji takich jak Tempo lub ilości basów w utworach, aby utworzyć grupy, ale nie posunąłem się za daleko z tym podejściem (wykrywanie uderzeń oparte na zmianach …
Próbuję wyodrębnić funkcje z pliku dźwiękowego i sklasyfikować dźwięk jako należący do określonej kategorii (np. Szczekanie psa, silnik pojazdu itp.). Chciałbym wyjaśnić następujące kwestie: 1) Czy to w ogóle wykonalne? Istnieją programy rozpoznające mowę i rozróżniające różne rodzaje szczekania psa. Ale czy można mieć program, który może odbierać próbkę dźwięku …
Teraz przetwarzam plik MP3 i napotkałem ten problem. Moje MP3 jest zakodowane stereo. Chcę wyodrębnić partię wokalną do dalszego przetwarzania (niezależnie od trybu sygnałów wyjściowych, mono lub stereo). O ile mi wiadomo, audio jest zakodowane w różnych pasmach sub-dis-joint w MP3. Myślę, że mogę ograniczyć sygnały do zakresu głosu poprzez …
Obliczam FFT z wejścia mikrofonu. Zauważam, że niższe częstotliwości zawsze wydają się mieć większą moc (wyższe dB) niż wyższe częstotliwości. Tnę dane na ramki 24576 bajtów (4096 * 6). Zastosuj okno Hamminga: input[i] *= (0.54d - 0.46d*(double) Math.Cos((2d*Math.PI*i)/fs)); Uruchom go przez FFTW Process1D(). Konwertuj z liczb zespolonych: output[i] = 10.0 …
Próbuję obliczyć głośność ścieżki dźwiękowej, którą zapisałem w buforze. Bufor zawiera dane PCM sygnału i chcę dowiedzieć się, jak „głośno” jest za pomocą Root Mean Squared. Zakładam, że mogę to zrobić w dziedzinie czasu zamiast przełączać się na dziedzinę częstotliwości. Jaki byłby na to pseudo-kod? Czy po prostu próbowałem przez …
Jeden z moich weekendowych projektów wprowadził mnie w głębokie wody przetwarzania sygnałów. Podobnie jak w przypadku wszystkich moich projektów kodu, które wymagają trochę matematyki, cieszę się, że majsterkuję, aby znaleźć rozwiązanie pomimo braku teoretycznego uziemienia, ale w tym przypadku nie mam żadnego i chętnie poradzę na mój problem , a …
Próbuję dowiedzieć się, w jaki sposób (jeśli to możliwe) wyodrębnić komponenty częstotliwości arbitralnej próbki audio (zazwyczaj muzyki) w sposób podobny do FFT, ale w swoich badaniach nad algorytmem FFT dowiaduję się, że cierpi on na pewne surowe ograniczenia w tym celu. Istnieją 3 problemy, które przedstawia FFT: Ponieważ rozdzielczość bin …
Szukam dobrych narzędzi do przetwarzania sygnału audio. np. analiza mowy i muzyki, automatyczna identyfikacja języka itp. Czy biblioteka Scipy zapewnia funkcje przetwarzania dźwięku? Czy ma dobre narzędzie do przetwarzania sygnału audio? Czy możesz zasugerować do tego narzędzie?
Zaprojektowanie prostego filtru pasmowego IIR II rzędu z filtrem Buterwortha o częstotliwości środkowej 500 Hz i szerokości pasma 1 oktawy daje mi następujące pasmo przenoszenia ... Teraz, jeśli wezmę odpowiedź impulsową i znormalizuję ją i przekonwertuję na dB, możemy zaobserwować zanik odpowiedzi impulsowej. Zanik reakcji impulsowej jest w przybliżeniu liniowy …
Mam małą aplikację w stylu karaoke, w której użytkownik śpiewa 4 wiersze piosenki, z jedną sekundą przerwy między nimi. Nie ma podkładu muzycznego, więc jest to tylko głos, miejmy nadzieję, że problem będzie łatwiejszy do rozwiązania. Szukam najbardziej niezawodnego sposobu na dokładne wykrycie, gdzie w moim nagraniu użytkownik rozpoczyna i …
Jakich technik można użyć do oszacowania czasu rozpoczęcia wybuchu sinusoidalnego tonu w głośnym sygnale? Załóżmy, że impuls tonowy ma znaną stałą częstotliwość (ale nieznaną fazę) i bardzo ostry czas narastania, a celem jest oszacowanie czasu rozpoczęcia w czasie lepszym niż połowa czasu narastania i / lub jednego okresu częstotliwości tonu …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.