Jak modelować zachowania zakupowe użytkownika w Amazon?


9

W naszym ostatnim projekcie kursu z Data Science zaproponowaliśmy następujące-

Daj opinie Amazon zestawu danych , planujemy wymyślić algorytm (to z grubsza na podstawie spersonalizowanej PageRank), który określa strategiczne położenie na umieszczanie reklam na Amazon. Na przykład w Amazon są miliony produktów. A zestaw danych daje wyobrażenie o tym, jakie produkty są powiązane, jakie produkty zostały zebrane, wyświetlone razem itp. (Możemy zbudować wykres z tymi informacjami, które są również przeglądane i kupowane). Daje także recenzje związane z każdym produktem 14 lat. Korzystając z tych wszystkich informacji, będziemy oceniać / klasyfikować produkty w Amazon. Teraz jesteś sprzedawcą w Amazon, który chce poprawić ruch na swojej stronie produktu. Nasz algorytm pomaga zidentyfikować strategiczne pozycje na wykresie, na których można umieścić reklamę, aby uzyskać maksymalny ruch.

Pytanie naszego profesora brzmi: jak zweryfikujesz swój algorytm bez prawdziwych użytkowników? Powiedzieliśmy-

Możemy modelować stały zestaw użytkowników. Niektórzy użytkownicy śledzą also_boughti also_viewedprowadzą do trzeciego przeskoku częściej niż pierwszy lub piąty przeskok. Tam zachowanie użytkowników jest zwykle rozpowszechniane. Niektórzy inni użytkownicy z trudem wychodzą poza pierwszy skok. Ten zestaw zachowań użytkowników jest dystrybuowany wykładniczo.

Nasz profesor powiedział - Niezależnie od tego, jaką dystrybucję śledzą użytkownicy, użytkownicy nawigują za pomocą łączy do podobnych produktów. Twój algorytm rankingu uwzględnia również podobieństwo między 2 produktami do rankingu produktów. Tak więc użycie tego algorytmu sprawdzania poprawności jest trochę lepsze cheating. Przyjdź z innym zachowaniem użytkownika, czymś bardziej realistycznym i prostopadłym do algorytmu.

Wszelkie pomysły na modelowanie zachowania użytkowników? Z przyjemnością przedstawię więcej szczegółów na temat algo.

Odpowiedzi:


1

Jak zweryfikujesz swój algorytm?

Zamiast próbować odpowiedzieć na drugie pytanie, zastanów się, że twoja odpowiedź na pierwsze pytanie może wymagać korekty ...

Jakich metod używałeś do sprawdzania poprawności metod uczenia się podczas lekcji danych? Najpierw chcesz zdefiniować konkretny zestaw wskaźników numerycznych, aby ocenić sukces lub porażkę swojego modelu. Po drugie, jakich metod można użyć do stworzenia bardzo realistycznej populacji testowej (bardziej realistycznej niż modelowanie populacji)? Pierwszą wskazówką, którą dam, jest to, że zestaw danych Amazon Reviews jest bardzo duży, więc twoje dane można bardzo łatwo modyfikować za pomocą tej metody. Druga wskazówka, którą podam, jest taka, że ​​prawdopodobnie jest to metoda, którą zastosowałeś w 95% nadzorowanych problemów z nauką, nad którymi pracowałeś w klasie ...

Mam nadzieję, że to pomoże ... Zmienię to, jeśli zajdzie taka potrzeba, na podstawie komentarzy dodanych przez PO, ale nie chcę od razu podać rozwiązania, aby wywołać organiczną myśl, np. Ponieważ jest to problem klasowy, a Prof jest starając się również pomóc ci samodzielnie znaleźć właściwe rozwiązanie.


0

Istnieją dwa wymagania dotyczące modelu zachowania, które należy zastosować: (1) „bardziej realistyczny” i (2) prostopadły do ​​algorytmu.

(1) Przyjmując realistycznie, załóżmy, że oznacza to, że zachowanie powinno odzwierciedlać zachowania zaobserwowane w innych, szerszych kontekstach niż w konkretnym kontekście zakupów Amazon.

(2) Ortogonalny jest łatwiejszy do zrozumienia. Modelowane zachowanie nie powinno wynikać z podobieństwa między produktami.

Proste podejście do spełnienia tych dwóch wymogów wynikałoby z faktu, że zachowania zakupowe wynikają z cech społeczno-demograficznych, takich jak płeć, wiek, lokalizacja (np. Obszar miejski / wiejski) oraz ograniczenia ekonomiczne (dochód i cena).

Masz zestaw użytkowników i zestaw produktów. Możesz oszacować związek między zmiennymi społeczno-demograficznymi a popytem na produkt, stosując proste, ale ostrożne techniki regresji. W razie potrzeby można użyć zewnętrznych źródeł danych, aby przyjąć założenia dotyczące ważnych brakujących zmiennych, takich jak dochód.

Następnie, jeśli jesteś sprzedawcą, model społeczno-demograficzny przewidziałby, które grupy najprawdopodobniej kupią Twój produkt.

Mam nadzieję że to pomogło :)

Ben

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.