Transkrypcja muzyki polifonicznej nie wydaje się obecnie stanowić rozwiązania problemu.
Co powiesz na odwrót niewielkiej części problemu. Czy są jakieś cechy spektralne (z STFT), które można wykorzystać do wyeliminowania niektórych akordów muzycznych z przestrzeni prawdopodobieństwa? (np. ten fragment dźwięku najprawdopodobniej nie zawiera żadnego akordu C # lub jakiegokolwiek pomniejszonego akordu mniejszego, lub jest to pojedyncza nuta, nie akord itp.)
Załóżmy, że fragment dźwięku jest mniej więcej stacjonarny (usunięto przejściowy atak itp.) I że podteksty dla większości lub wszystkich pojedynczych nut są bardzo prawdopodobne. (I to pytanie nie dotyczy odwróconych akordów).