Zestawy danych porównawczych do wspólnego filtrowania


9

Chciałbym przetestować nowy algorytm wspólnego filtrowania . Typowym przypadkiem użycia jest polecanie filmów na podstawie preferencji użytkowników podobnych do konkretnego użytkownika.

Jakie są typowe zestawy danych porównawczych, których naukowcy często używają do testowania swoich algorytmów? Wiem, że w ramach Computer Vision ludzie często używają MNIST lub CIFAR, ale nie znalazłem podobnych zestawów danych do wspólnego filtrowania.


1
Czy spojrzałeś na zestaw nagród Netflix? Tak, konkurencja już dawno się zakończyła i została usunięta z oficjalnej strony z powodów związanych z prywatnością. Nadal możesz spróbować znaleźć go w innych lokalizacjach.
Vladislavs Dovgalecs

Kaggle.com ma sporo. Wystarczy wyszukać „zalecenie w: zbiór danych” lub „zalecenie w: konkurs”.
ran8

Odpowiedzi:


8

Oczywistą odpowiedzią byłby zestaw nagród Netflix, jest wiele badań i większość algorytmów CF ma w nim oceny.

Istnieją inne dostępne zestawy danych, które są zwykle używane jako punkty odniesienia:


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.