Czy można zrozumieć koncepcyjnie model Pareto / NBD?


12

Uczę się korzystać z pakietu BTYD, który korzysta z modelu Pareto / NBD, aby przewidzieć, kiedy będzie oczekiwany powrót klienta. Jednak cała literatura na temat tego modelu jest pełna matematyki i nie wydaje się, aby istniało proste / koncepcyjne wyjaśnienie działania tego modelu. Czy można zrozumieć model Pareto / NBD dla nie matematyków? Przejrzałem ten słynny artykuł autorstwa Fadera . Model Pareto / NBD przyjmuje następujące założenia:

ja. Gdy jest aktywny, liczba transakcji dokonanych przez klienta w okresie czasu t rozkłada Poissona ze współczynnikiem transakcji λ.

ii. Niejednorodność stawek transakcyjnych wśród klientów jest zgodna z rozkładem gamma z parametrem kształtu r i parametrem skali α.

iii. Każdy klient ma nieobserwowany „okres istnienia” długości τ. Ten punkt, w którym klient staje się nieaktywny, jest rozkładany wykładniczo wraz ze współczynnikiem rezygnacji µ.

iv) Heterogeniczność współczynników porzucania u klientów jest zgodna z rozkładem gamma z parametrami kształtu i parametrem skali β.

v. Współczynnik transakcji λ i współczynnik rezygnacji µ różnią się niezależnie między klientami. ”

Nie rozumiem (intuicji) uzasadnienia założeń (ii), (iii) i (iv). Dlaczego tylko te dystrybucje, dlaczego nie inne?

Również założenia modelu BG / NBD to:

i.) Podczas aktywności liczba transakcji dokonywanych przez klienta jest zgodna z procesem Poissona ze współczynnikiem transakcji λ. Jest to równoważne z założeniem, że czas między transakcjami jest rozkładany wykładniczo ze stopą transakcji λ

ii) Heterogeniczność w λ wynika z rozkładu gamma

iii) Po każdej transakcji klient staje się nieaktywny z prawdopodobieństwem str. Dlatego punkt, w którym klient „rezygnuje”, jest rozkładany na transakcje zgodnie z (przesuniętym) rozkładem geometrycznym z pmf

iv) Heterogeniczność w p jest zgodna z rozkładem beta

(Intuicyjna) racjonalność założeń (ii), (iii) i (iv) również nie są wcale oczywiste.

Będę wdzięczny za wszelką pomoc. Dzięki.


Czy mógłbyś dodać odniesienie do literatury, która jest dla ciebie trudna?
kjetil b halvorsen

Opracowałem tam, gdzie rzeczy są niejasne. Wiem, że nie jest łatwo wprowadzić intuicję do gry, ale gdyby było to możliwe, będzie to bardzo pomocne. Dzięki.
user3282777

Odpowiedzi:


14

Wyobraź sobie, że jesteś nowo mianowanym kierownikiem kwiaciarni. Masz zapis zeszłorocznych klientów - częstotliwość, z jaką robią zakupy i czas, jaki upłynął od ich ostatniej wizyty. Chcesz wiedzieć, ile firm mogą przynieść w tym roku klienci z listy. Jest kilka rzeczy do rozważenia:

[założenie (ii)] Klienci mają różne nawyki zakupowe.

λλ

Dystrybucja musi mieć kilka parametrów (niekoniecznie masz dużo danych), aby być dość elastycznym (prawdopodobnie nie jesteś przedsiębiorczym guru czytającym w myślach i nie wiesz wszystkiego o zwyczajach zakupowych), i wziąć wartości w dodatnich liczbach rzeczywistych. Rozkład gamma zaznacza wszystkie te pola i jest dobrze zbadany i stosunkowo łatwy w obsłudze. Jest często używany jako pierwszeństwo dla pozytywnych parametrów w różnych ustawieniach.

[założenie (iii)] Być może straciłeś już niektórych klientów na liście.

Jeśli Andrea kupowała kwiaty raz w miesiącu co miesiąc w ubiegłym roku, to dość bezpieczny zakład, że wróci w tym roku. Jeśli Ben kupował kwiaty co tydzień, ale nie było go od miesięcy, to może znalazł inną kwiaciarnię. Tworząc przyszłe biznesplany, możesz liczyć na Andreę, ale nie na Bena.

Klienci nie powiedzą ci, kiedy przeprowadzili się do kolejnego etapu. W obu modelach pojawia się założenie „nieobserwowanego życia”. Wyobraź sobie trzeciego klienta, Cary. Modele Pareto / NBD i BG / NBD dają dwa różne sposoby myślenia o tym, jak Cary porzuci sklep na dobre.

W przypadku Pareto / NBD wyobraź sobie, że w dowolnym momencie istnieje niewielka szansa, że ​​Cary natknie się na lepszy sklep niż twój. To ciągłe, nieskończenie małe ryzyko daje wykładniczy czas życia - i im dłużej minęło od ostatniej wizyty Cary'ego, tym dłużej był on narażony na inne (potencjalnie lepsze) kwiaciarnie.

Sprawa BG / NBD jest nieco bardziej przemyślana. Za każdym razem, gdy Cary pojawia się w twoim sklepie, stara się kupować kwiaty. Podczas przeglądania zastanawia się nad zmianami ceny, jakości i różnorodności od czasu swojej ostatniej wizyty, co ostatecznie sprawi, że zdecyduje, czy wróci następnym razem, czy poszuka innego sklepu. Więc zamiast być stale zagrożonym, Cary ma pewne prawdopodobieństwo, że zdecyduje się odejść po każdym zakupie.

[założenie (iv)] Nie wszyscy klienci są w równym stopniu zaangażowani w Twój sklep.

Niektórzy klienci są stałymi bywalcami i tylko śmierć - lub gwałtowny wzrost cen - zmusi ich do odejścia. Inni mogą chcieć odkrywać i chętnie zostawią cię ze względu na nową kwiaciarnię po drugiej stronie ulicy. Zamiast jednego wskaźnika rezygnacji dla wszystkich klientów, sensowniej jest mieć rozkład wskaźników rezygnacji (lub prawdopodobieństwa w przypadku BG / NBD).

μ(0;1)

Mam nadzieję, że to pomoże. Spójrz na oryginalny artykuł (Schmittlein i in., 1987), jeśli jeszcze tego nie zrobiłeś - przejdą przez pewną intuicję.


Dzięki za tak ciężką pracę i jasne wyjaśnienie. Powodem korzystania z dystrybucji gamma jest to, że jest stosunkowo łatwa w obsłudze i często jest używana jako pierwszeństwo dla pozytywnych parametrów w różnych ustawieniach. Chociaż kształty większości rozkładu gamma (o różnych wartościach parametrów) są łatwe do zrozumienia, ale można dopasować „Heterogeniczność w stawkach transakcji między klientami” do rozkładu gamma, który prawie spada wykładniczo (dla k = 1, theta = 2 jak na wykresie w Wikipedii [ tutaj] en.wikipedia.org/wiki/Gamma_distribution ) jest trochę trudny do zrozumienia. Czy wykluczamy takie zachowanie?
user3282777

1
Twoje oszacowania parametrów Gamma będą zależeć od danych, z którymi pracujesz. Chodzi o to, że rozkład gamma może mieć znacznie różne kształty w oparciu o tylko dwa parametry i możesz pozwolić, aby dane mówiły same za siebie, bez narzucania zbyt rygorystycznych założeń (mniej więcej).
Lyuba B.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.