Naiwny predyktor Bayesa dokonuje swoich przewidywań, używając tej formuły:
gdzie jest czynnikiem normalizującym. Wymaga to oszacowania parametrów P ( X i = x i | Y = y ) na podstawie danych. Jeśli zrobimy to za pomocą wygładzania K , otrzymamy oszacowanie
tam, gdzie to możliwe wartości X ı . Nic mi nie jest. Jednak dla wcześniejszych mamy
gdzie w zestawie danych znajduje się przykładów. Dlaczego nie wygładzimy również wcześniejszego? Albo raczej, nie możemy wygładzić przeora? Jeśli tak, jaki parametr wygładzania wybieramy? Wybieranie k również wydaje się głupie , ponieważ wykonujemy inne obliczenia. Czy istnieje konsensus? Czy to nie ma większego znaczenia?