Jaki jest swobodnie dostępny zestaw danych do klasyfikacji z ponad 1000 cech (lub punktów próbkowania, jeśli zawiera krzywe)?
Istnieje już wiki społeczności o wolnych zestawach danych: Lokalizowanie swobodnie dostępnych próbek danych
Ale tutaj byłoby miło mieć bardziej szczegółową listę, z której można wygodniej korzystać , proponuję również następujące zasady:
- Jeden post na zestaw danych
- Brak linku do zestawu danych
każdy zestaw danych musi być powiązany
nazwisko (aby dowiedzieć się, o co chodzi) i link do zbioru danych (zbiory danych R można nazwać z nazwą pakietu)
liczba funkcji (powiedzmy, że to p ) rozmiar zbioru danych (powiedzmy, że to n ) i liczba etykiet / klasy (powiedzmy, że to k )
typowy poziom błędu z twojego doświadczenia (podaj użyty algorytm w słowach) lub z literatury (w tym ostatnim przypadku połącz papier)