Większość naiwnych podejść do problemu wiąże się z poważnymi problemami. Najgorszy jest sposób, w jaki bash.org i qdb.us wyświetlają cytaty - użytkownicy mogą głosować w górę (+1) lub w dół (-1), a lista najlepszych cytatów jest sortowana według całkowitego wyniku netto. Cierpi na tym okropne uprzedzenie czasowe - starsze cytaty zgromadziły ogromną liczbę pozytywnych głosów dzięki prostej długowieczności, nawet jeśli są tylko marginalnie humorystyczne. Ten algorytm może mieć sens, jeśli dowcipy stawały się zabawniejsze wraz z wiekiem, ale - wierz mi - tak się nie dzieje.
Istnieją różne próby rozwiązania tego problemu - patrząc na liczbę pozytywnych głosów w danym okresie, ważenie nowszych głosów, wdrażanie systemu zanikania starszych głosów, obliczanie stosunku głosów pozytywnych do negatywnych itp. Większość z nich ma inne wady.
Najlepszym rozwiązaniem - jak sądzę - jest takie, które wykorzystuje serwisy The Funniest The Cutest , The Fairest i Best Thing - zmodyfikowany system głosowania Condorcet :
System nadaje każdemu liczbę w oparciu o rzeczy, z którymi się zmierzył, jaki procent z nich zwykle bije. Więc każdy z nich otrzymuje wynik procentowy NumberOfThingsIBeat / (NumberOfThingsIBeat + NumberOfThingsThatBeatMe). Ponadto rzeczy są wykluczane z górnej listy, dopóki nie zostaną porównane z rozsądnym procentem zestawu.
Jeśli w zestawie jest zwycięzca Condorcet, ta metoda go znajdzie. Ponieważ jest to mało prawdopodobne, biorąc pod uwagę charakter statystyczny, znajduje to, kto jest „najbliżej” zwycięzcy Condorceta.
Więcej informacji na temat wdrażania takich systemów można znaleźć na stronie Wikipedii o parach rankingowych .
Algorytm wymaga od ludzi porównania dwóch obiektów (opcja Pick-A-or-B), ale szczerze mówiąc, to dobrze. Uważam, że w teorii podejmowania decyzji bardzo dobrze przyjmuje się, że ludzie znacznie lepiej radzą sobie z porównywaniem dwóch obiektów niż w rankingu abstrakcyjnym. Miliony lat ewolucji sprawiają, że jesteśmy dobrzy w zrywaniu najlepszego jabłka z drzewa, ale straszni w decydowaniu o tym, jak blisko zerwane jabłko wyrasta z prawdziwą platońską formą zastosowania. (Nawiasem mówiąc, to jest powód, dla którego proces hierarchii analitycznej jest tak sprytny ... ale to jest trochę poza tematem.)
Ostatnim punktem, na który należy zwrócić uwagę, jest to, że SO używa algorytmu do znajdowania najlepszych odpowiedzi, który jest bardzo podobny do algorytmu bash.org w celu znalezienia najlepszego cytatu. Tutaj działa dobrze, ale tam bardzo zawodzi - w dużej mierze dlatego, że stara, wysoko oceniana, ale teraz przestarzała odpowiedź tutaj prawdopodobnie zostanie zredagowana. bash.org nie pozwala na edycję i nie jest jasne, w jaki sposób można by nawet edytować sprzed dziesięcioleci dowcipy o przestarzałych memach internetowych, nawet gdybyś mógł ... W każdym razie chodzi mi o to, że zwykle odpowiedni algorytm zależy od szczegółów twojego problemu. :-)