Odpowiedzi:
Jeśli testujesz wydajność modelu (tzn. Nie optymalizujesz parametrów), na ogół sumujesz macierze pomieszania. Pomyśl o tym w ten sposób, podzieliłeś swoje dane na 10 różnych foldów lub zestawów „testowych”. Trenujesz swój model na 9/10 zgięć, testujesz pierwsze zgięcie i otrzymujesz macierz dezorientacji. Ta macierz nieporozumień reprezentuje klasyfikację 1/10 danych. Powtórz analizę ponownie z następnym zestawem „testowym” i uzyskaj kolejną macierz nieporozumień reprezentującą kolejną 1/10 danych. Dodanie tej nowej macierzy pomyłek do pierwszej reprezentuje teraz 20% twoich danych. Kontynuujesz, dopóki nie uruchomisz wszystkich foldów, zsumujesz wszystkie macierze nieporozumień, a ostateczna macierz nieporozumień reprezentuje wydajność tego modelu dla wszystkich danych. Możesz uśrednić macierze pomieszania, ale tak naprawdę nie zapewnia to żadnych dodatkowych informacji z macierzy skumulowanej i może być stronniczy, jeśli twoje fałdy nie są tego samego rozmiaru.
Uwaga - zakłada to, że twoje dane nie są powtarzane. Nie jestem całkowicie pewien, czy byłoby inaczej w przypadku powtarzania próbkowania. Zaktualizuje się, jeśli się czegoś nauczę lub ktoś poleci metodę.