Pracuję nad projektem w Pythonie, aby wykryć i sklasyfikować jakąś piosenkę ptasią, i znalazłem się w sytuacji, w której muszę przekonwertować plik fali na dane częstotliwości w funkcji czasu. Nie stanowiło to większego problemu, ale aby móc sklasyfikować różne sylaby w grupy, muszę napisać coś, co wykryje, gdy dane skupią się w określonym kształcie. Aby dać wyobrażenie o tym, jak wyglądają dane, oto obraz tego, jak wyglądają dane po wydrukowaniu:
Potrzebuję jakiegoś sposobu, aby uzyskać każdą sylabę (każdy kształt z separacją po obu stronach) i zapisać je w zmiennej lub we własnych plikach, abym mógł uruchomić korelację Pearsona między nimi za pomocą SciPy.
Ponadto wolę Python, ale jestem otwarty na kodowanie w innych językach, jeśli masz inny sposób.
Dzięki!