Tak, niektórzy z nas mogą to zrobić, możesz przyspieszyć lub zwolnić bez wpływu na wysokość, niektórzy nazywają to aplikacjami Time Stretch, istnieją różne sposoby, możesz to zrobić w dziedzinie częstotliwości lub dziedzinie czasu, będziesz musiał wybrać co jest dla Ciebie najlepsze, znajdziesz wady i zalety każdego z nich.
Domena czasu:
W domenie czasu możesz wypróbować kilka technik, takich jak:
- TDHS (Sacaling harmoniczne w dziedzinie czasu)
- SOLA (synchroniczne dodawanie nakładek)
- PSOLA (Pitch Synchronous Overlap Add)
- WSOLA (Dodanie podobieństwa kształtu fali)
Plusy: Jest szybki, niektóre algorytmy są łatwe do zrozumienia, dobra jakość w dźwiękach monofonicznych.
Minusy: Ogólnie rzecz biorąc, potrzebujesz bardzo dobrej ścieżki do łączenia w odpowiedniej pozycji, trudno to zrobić :-(, więc jeśli twoja ścieżka nie działa lub nie działa w dźwiękach polifonicznych, algorytmy te dają wiele błędów / artefaktów w dźwięku wyjściowym.
Domena częstotliwości:
Cały odcinek czasu, który znam w dziedzinie częstotliwości, oparty jest na wokoderze fazowym technikach .
Plusy: będą działać przy dźwiękach polifonicznych lub monofonicznych.
Minusy: Może być bolesne zrozumienie całej matematyki, implementacja jest nieco trudna, nie jest tak szybka jak kody w dziedzinie czasu, dla głosu wolę wyniki w dziedzinie czasu, niektóre sztuczki w celu poprawy wyniku standardowego wokodera fazy nie są wspólne.
Mogę powiedzieć, że rozmiar okna i przeskoku jest jednym z kluczowych parametrów jakości wokodera fazowego, generalnie wybieramy 4x
nakładanie się na resyntezę, jedno okno wielkości hann 4096
jest wystarczające dla moich uszu (oczywiście jeśli masz moc przetwarzania dla tych rozmiarów) , standardowy wokoder fazy może dodać efekty pogłosu, aby uniknąć tego rodzaju problemów, które mogą być potrzebne do zablokowania fazy.
Dla datailed spojrzeć w Miller Puckette i Portnoff papieru