Mam kilka rozkładów (10 rozkładów na poniższym rysunku).
W rzeczywistości są to histogramy: na osi x znajduje się 70 wartości, które są wielkościami niektórych cząstek w roztworze, a dla każdej wartości x odpowiadająca wartość y jest proporcją cząstek, których wielkość jest zbliżona do wartości x.
Chciałbym zgrupować te dystrybucje. Obecnie używam hierarchicznego grupowania na przykład z odległością euklidesową. Wybór odległości nie satysfakcjonuje mnie. Próbowałem teoretycznej odległości, takiej jak Kullback-Leibler, ale w danych jest wiele zer, co powoduje trudności. Czy masz propozycję odpowiedniej odległości i / lub innej metody grupowania?