Jestem nowy w uczeniu maszynowym, więc próbuję znaleźć literaturę, ale nie jestem nawet pewien, po co Google. Moje dane mają następującą formę:
User A performs Action P
User B performs Action Q
User C performs Action R
...
User C performs Action X
User A performs Action Y
User B performs Action Z
...
Gdzie każda akcja ma określone cechy (data, godzina, klient itp.). Jest około 300 użytkowników, a my mamy około 20 000 działań.
Pytanie :
Chcę dowiedzieć się, czy istnieje jakaś przyczynowość / korelacja między działaniami użytkownika. Na przykład „za każdym razem, gdy użytkownik E wykonuje akcję T, 2 dni później użytkownik G wykonuje akcję V.”. Ale pomiędzy nimi może być wielu innych użytkowników wykonujących wiele innych działań i możliwe, że nie będzie żadnej korelacji. Możliwe jest również, że niektórzy użytkownicy są skorelowani, ale inni są całkowicie niezależni. Czy jest to coś, co może znaleźć dla mnie uczenie maszynowe? Czy istnieje jakiś algorytm lub zestaw algorytmów, który mógłby mi pomóc?
Czytałem o analizie asocjacji i algorytmie Apriori, ale nie sądzę, że da mi to, czego potrzebuję, ponieważ wydaje się, że wymaga to znanych, dobrze odgraniczonych zestawów danych jako danych wejściowych, podczas gdy mam po prostu długi strumień pozornie losowego użytkownika działania. Wszelkie sugestie dotyczące tego, na co spojrzeć, będą mile widziane!
P