W naszym ostatnim projekcie kursu z Data Science zaproponowaliśmy następujące-
Daj opinie Amazon zestawu danych , planujemy wymyślić algorytm (to z grubsza na podstawie spersonalizowanej PageRank), który określa strategiczne położenie na umieszczanie reklam na Amazon. Na przykład w Amazon są miliony produktów. A zestaw danych daje wyobrażenie o tym, jakie produkty są powiązane, jakie produkty zostały zebrane, wyświetlone razem itp. (Możemy zbudować wykres z tymi informacjami, które są również przeglądane i kupowane). Daje także recenzje związane z każdym produktem 14 lat. Korzystając z tych wszystkich informacji, będziemy oceniać / klasyfikować produkty w Amazon. Teraz jesteś sprzedawcą w Amazon, który chce poprawić ruch na swojej stronie produktu. Nasz algorytm pomaga zidentyfikować strategiczne pozycje na wykresie, na których można umieścić reklamę, aby uzyskać maksymalny ruch.
Pytanie naszego profesora brzmi: jak zweryfikujesz swój algorytm bez prawdziwych użytkowników? Powiedzieliśmy-
Możemy modelować stały zestaw użytkowników. Niektórzy użytkownicy śledzą
also_bought
ialso_viewed
prowadzą do trzeciego przeskoku częściej niż pierwszy lub piąty przeskok. Tam zachowanie użytkowników jest zwykle rozpowszechniane. Niektórzy inni użytkownicy z trudem wychodzą poza pierwszy skok. Ten zestaw zachowań użytkowników jest dystrybuowany wykładniczo.
Nasz profesor powiedział - Niezależnie od tego, jaką dystrybucję śledzą użytkownicy, użytkownicy nawigują za pomocą łączy do podobnych produktów. Twój algorytm rankingu uwzględnia również podobieństwo między 2 produktami do rankingu produktów. Tak więc użycie tego algorytmu sprawdzania poprawności jest trochę lepsze cheating
. Przyjdź z innym zachowaniem użytkownika, czymś bardziej realistycznym i prostopadłym do algorytmu.
Wszelkie pomysły na modelowanie zachowania użytkowników? Z przyjemnością przedstawię więcej szczegółów na temat algo.