Mam dwa zestawy danych (dane źródłowe i docelowe), które mają różny rozkład. Korzystam z MMD - czyli nieparametrycznego rozkładu odległości - aby obliczyć rozkład krańcowy między danymi źródłowym i docelowym. dane źródłowe, Xs dane docelowe, Xt adaptacja Matryca A * Dane prognozowane, Zs = A '* Xs i Zt = …
Podejmuję się projektu analizy danych, który obejmuje badanie czasu użytkowania strony internetowej w ciągu roku. Chciałbym porównać, jak „spójne” wzorce użytkowania są, powiedzmy, jak blisko są do wzorca, który wymaga używania go przez 1 godzinę raz w tygodniu, lub takiego, który obejmuje używanie go przez 10 minut na raz, 6 …
Patrzyłem na stronę wikipedii, aby znaleźć korelację odległości, na której wydaje się, że cechuje ją sposób jej obliczenia. O ile mogłem zrobić obliczenia walczę aby uzyskać środki korelacji jakiej odległości i dlatego obliczenia wyglądają tak robią. Czy istnieje (lub wiele) bardziej intuicyjna charakterystyka korelacji odległości, która mogłaby pomóc mi zrozumieć, …
Korzystam z oznacza grupowanie głosów w klastrze. Kiedy porównuję wypowiedź do danych głośników w klastrze, otrzymam (na podstawie odległości euklidesowej) średnie zniekształcenie. Odległość ta może wynosić . Chcę przekonwertować tę odległość na wynik podobieństwa . Proszę o wskazówki, jak to osiągnąć.[ 0 , ∞ ] [ 0 , 1 ]kkk[0,∞][0,∞][0,\infty][0,1][0,1][0,1]
Badając odległość Kullbacka – Leiblera, bardzo szybko dowiadujemy się dwóch rzeczy, że nie szanuje ani nierówności trójkąta, ani symetrii, wymaganych właściwości metryki. Moje pytanie dotyczy tego, czy istnieje metryka funkcji gęstości prawdopodobieństwa, która spełnia wszystkie ograniczenia metryki .
W przypadku hierarchicznego grupowania często widzę następujące dwie „metryki” (nie do końca mówią) do pomiaru odległości między dwiema losowymi zmiennymi i : \ newcommand {\ Cor} {\ mathrm {Cor}} \ begin {align} d_1 (X, Y) i = 1- | \ Cor (X, Y) |, \\ d_2 (X, Y) i = …
Rozumiem uzasadnienie normalizacji kolumn, ponieważ powoduje, że cechy są ważone równo, nawet jeśli nie są mierzone w tej samej skali - jednak często w literaturze najbliższego sąsiada zarówno kolumny, jak i wiersze są znormalizowane. Do czego służy normalizacja wierszy / dlaczego normalizować wiersze? W szczególności, w jaki sposób wynik normalizacji …
Mam 17 liczbowych i 5 zmiennych binarnych (0-1), z 73 próbkami w moim zbiorze danych. Muszę przeprowadzić analizę skupień. Wiem, że odległość Gowera jest dobrą miarą dla zbiorów danych ze zmiennymi mieszanymi. Nie mogłem jednak zrozumieć, w jaki sposób odległość Gowera oblicza różnicę między zmiennymi binarnymi . Wydaje mi się, …
Mam ponad 3000 wektorów na dwuwymiarowej siatce o mniej więcej jednolitym dyskretnym rozkładzie. Niektóre pary wektorów spełniają określony warunek. Uwaga: warunek dotyczy tylko par wektorów, a nie pojedynczych wektorów. Mam listę około 1500 takich par, nazwijmy to grupą 1. Grupa 2 zawiera wszystkie inne pary wektorów. Chcę dowiedzieć się, czy …
Załóżmy, że mam mieszankę skończonej liczby Gaussów ze znanymi wagami, średnimi i standardowymi odchyleniami. Średnie nie są równe. Oczywiście można obliczyć średnią i odchylenie standardowe mieszaniny, ponieważ momenty są ważonymi średnimi momentów składników. Mieszanina nie ma rozkładu normalnego, ale jak daleko jest od normalności? Powyższy obraz pokazuje gęstości prawdopodobieństwa dla …
Nie wiem, jakiej funkcji odległości między osobami należy użyć w przypadku nominalnych (nieuporządkowanych atrybutów kategorialnych). Czytałem jakiś podręcznik i sugerują one funkcję Simple Matching, ale niektóre książki sugerują, że powinienem zmienić atrybuty nominalne na binarne i użyć współczynnika Jaccard . Co jednak, jeśli wartości atrybutu nominalnego nie wynoszą 2? co …
Kolega ma funkcję i dla naszych celów jest to czarna skrzynka. Funkcja mierzy podobieństwo dwóch obiektów.s ( a , b )ssss ( a , b )s(a,b)s(a,b) Wiemy na pewno, że ma następujące właściwości:sss Podobieństwa są liczbami rzeczywistymi od 0 do 1 włącznie. Tylko obiekty, które są identyczne, mają wyniki równe …
Mam macierzy kowariancji i chcę podzielić zmienne na klastrów za pomocą hierarchicznego grupowania (na przykład, aby posortować macierz kowariancji).kn × nn×nn \times nkkk Czy istnieje typowa funkcja odległości między zmiennymi (tj. Między kolumnami / rzędami kwadratowej macierzy kowariancji)? A jeśli jest ich więcej, czy istnieje dobre odniesienie do tematu?
Nie jestem ekologiem społeczności, ale obecnie pracuję nad danymi dotyczącymi ekologii społeczności. To, czego nie mogłem zrozumieć, oprócz matematyki tych odległości, to kryteria dla każdej odległości do wykorzystania i w jakich sytuacjach można ją zastosować. Na przykład, czego używać z danymi zliczania? Jak przekonwertować kąt nachylenia między dwiema lokalizacjami na …
Ostatnio dużo czytałem o Dynamic Time Warping (DTW). Jestem bardzo zaskoczony, że w ogóle nie ma literatury na temat zastosowania DTW do nieregularnych szeregów czasowych, a przynajmniej nie mogłem jej znaleźć. Czy ktoś mógłby podać mi odniesienie do czegoś związanego z tym problemem, a może nawet jego wdrożenie?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.