W tym semestrze mam kurs uczenia maszynowego, a profesor poprosił nas o znalezienie problemu w świecie rzeczywistym i rozwiązanie go jedną z metod uczenia maszynowego przedstawionych na zajęciach, takich jak:
- Drzewa decyzyjne
- Sztuczne sieci neuronowe
- Obsługa maszyn wektorowych
- Nauczanie oparte na instancjach ( kNN , LWL )
- Bayesian Networks
- Uczenie się przez wzmocnienie
Jestem jednym z fanów przelewania stosów i wymiany stosów i wiem, że zrzuty tych witryn są udostępniane publicznie, ponieważ są niesamowite! Mam nadzieję, że uda mi się znaleźć dobre wyzwanie w zakresie uczenia maszynowego dotyczące tych baz danych i rozwiązać je.
Mój pomysł
Przyszedł mi do głowy pomysł przewidywania tagów pytań na podstawie wprowadzonych słów w treści pytania. Myślę, że sieć bayesowska jest właściwym narzędziem do uczenia się znaczników do pytania, ale wymaga dalszych badań. W każdym razie, po fazie uczenia się, kiedy użytkownik kończy wprowadzanie pytania, należy mu zasugerować kilka tagów.
Proszę powiedz mi :
Chcę zapytać społeczność statystyk jako doświadczonych ludzi o ML dwa pytania:
Czy uważasz, że sugestia tagu to przynajmniej problem, który ma szansę rozwiązać? Czy masz jakieś porady na ten temat? Martwię się trochę, ponieważ stackexchange nie implementuje jeszcze takiej funkcji.
Czy masz jakiś inny / lepszy pomysł na projekt ML oparty na bazie danych Stackexchange? Naprawdę trudno mi znaleźć coś do nauczenia się w bazach danych stackexchange.
Uwagi na temat błędów bazy danych: Chciałbym wskazać, że chociaż bazy danych są ogromne i mają wiele instancji, nie są idealne i są podatne na błędy. Oczywistym jest niewiarygodny wiek użytkowników. Nawet wybrane tagi do pytania nie są w 100% poprawne. W każdym razie powinniśmy wziąć pod uwagę procent poprawności danych przy wyborze problemu.
Rozważanie na temat samego problemu: Mój projekt nie powinien dotyczyć data-miningczegoś takiego. Powinno to być po prostu zastosowanie metod ML w świecie rzeczywistym.