Po pierwsze, nie jestem statystykiem. Jednak robiłem analizę sieci statystycznej dla mojego doktoratu.
W ramach analizy sieci przedstawiłem komplementarną funkcję skumulowanego rozkładu (CCDF) stopni sieciowych. Odkryłem, że w przeciwieństwie do konwencjonalnych dystrybucji sieciowych (np. WWW), dystrybucję najlepiej dopasowuje rozkład logarytmiczny. Próbowałem dopasować ją do prawa mocy i używając skryptów Matlaba autorstwa Clauset et al. Odkryłem, że ogon krzywej podąża za prawem mocy z odcięciem.
Linia przerywana oznacza dopasowanie prawa mocy. Fioletowa linia reprezentuje log-normalne dopasowanie. Zielona linia reprezentuje dopasowanie wykładnicze.
Próbuję zrozumieć, co to wszystko znaczy? Przeczytałem ten artykuł Newmana, który lekko porusza ten temat: http://arxiv.org/abs/cond-mat/0412004
Poniżej moje dzikie przypuszczenie:
Jeśli rozkład stopni jest zgodny z rozkładem prawa mocy, rozumiem, że oznacza to liniowe preferencyjne przywiązanie w rozkładzie łączy i stopniu sieci (bogaty uzyskuje bogatszy efekt lub proces Yulesa).
Czy mam rację mówiąc, że przy logarytmicznym rozkładzie, którego doświadczam, na początku łuku występuje subliniowe przywiązanie preferencyjne i staje się bardziej liniowe w kierunku ogona, gdzie można je dopasować za pomocą prawa mocy?
Ponadto, ponieważ rozkład logarytmiczno-normalny występuje, gdy logarytm zmiennej losowej (powiedzmy X) jest normalnie rozkładany, oznacza to, że w logarytmicznym rozkładzie normalnym jest więcej małych wartości X i mniej dużych wartości X niż czy zmienna losowa występująca po rozkładzie prawa mocy miałaby?
Co ważniejsze, jeśli chodzi o rozkład stopnia sieci, czy normalne logarytmiczne przywiązanie preferencyjne nadal sugeruje sieć pozbawioną skali? Instynkt podpowiada mi, że skoro ogon krzywej może być dopasowany przez prawo mocy, sieć może nadal zostać uznana za wykazującą cechy pozbawione skali.