Jak opłacalne byłoby klasyfikowanie tekstury obrazu przy użyciu funkcji z dyskretnej transformacji kosinusowej? Googling „klasyfikacja tekstur dct” znajduje tylko jeden artykuł akademicki na ten temat, używając sieci neuronowej.
Do mojej aplikacji mam duży korpus oznakowanych obrazów, w których cały obraz ma spójną teksturę (np. Zbliżenia kocu, kory drzewa, trawiastego pola itp.).
Zainspirowany odpowiedzią na poprzednie pytanie , rozważałem następujące podejście:
- podzielić każdy obraz na bloki pikseli NxN
- weź DCT każdego bloku
- spłaszcz każdy DCT do tablicy 1xM i podaj go do algorytmu klastrowania K-Means, i uzyskaj etykietę klastra dla każdego DCT
- obliczyć histogram etykiet grupowania dla każdego obrazu, licząc każdą etykietę na obrazie od # 3
- wytrenuj klasyfikator SVM, podając mu zestaw [(histogram, etykieta obrazu)]
Jak dobrze by to działało? Zaimplementowałem podobny system, używając funkcji wyodrębnionych za pomocą algorytmów SIFT / SURF, ale byłem w stanie uzyskać jedynie około 60% dokładności.
W jaki inny sposób mogę użyć DCT do klasyfikacji tekstur?