Jako dodatek do odpowiedzi Penelope , dwie popularne rodziny (i modne) algorytmów.
Superpiksele
Bardzo popularna rodzina algorytmów o nazwie Superpixels jest teraz bardzo modna (jest nawet kilka sesji Superpixel na konferencjach CV). Superpiksele przypominają nadmierną segmentację (tak jak daje to przełom), więc wymagane jest pewne przetwarzanie końcowe.
Superpiksele można postrzegać jako małe jednorodne regiony obrazów . Odległość między pikselami jest oceniana jak w filtrowaniu dwustronnym, tj. Jest to mieszanka między ich odległością przestrzenną a ich podobieństwem wizualnym, która zbliża się do 0, gdy są one bliskie i podobne, a do innej większej wartości w przeciwnym razie.
Następnie metody superpikseli próbują różnych kryteriów w celu utworzenia małych jednorodnych regionów w odniesieniu do tej miary. Jest ich wiele (oparte na grafach, oparte na wyszukiwaniu trybów / klastrowaniu ...), więc myślę, że najlepiej odnieść cię do tego raportu technicznego .
(edytuj :) W przypadku, gdy ktoś szuka opublikowanej recenzji, ten artykuł jest autorstwa tych samych autorów i obejmuje ten sam materiał, co raport techniczny:
R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, S. Susstrunk: SLIC Superpixels w porównaniu do najnowocześniejszych metod superpikseli
Zauważ, jak napisałem pierwszą wersję odpowiedzi, że wizualnie wyniki są bardzo podobne do tego, co zapewnia nadsegmentacja przełomu. Potwierdzają to autorzy raportu technicznego, którzy uwzględniają przełom w powiązanej części pracy. Dlatego też musisz wykonać tę samą obróbkę końcową: podczas gdy superpiksele mogą być przydatnymi funkcjami zamiast pikseli, nadal trzeba je pogrupować, aby utworzyć regiony wyższego poziomu, jeśli potrzebujesz śledzić / wykrywać obiekty.
Metody segmentacji oparte na grafie
Inna popularna rodzina algorytmów pochodzi z analizy zależności między pikselami, tj. Tego, jak wyglądają piksele. Daje to rodzinę metod segmentacji opartych na teorii grafów, takich jak znormalizowane cięcie (J. Shi, J. Malik: Znormalizowane cięcia i segmentacja obrazu ) .
Oto intuicja tego podejścia: załóżmy, że twoje piksele są teraz punktami (wierzchołkami) wykresu wielowymiarowego.
Na wykresie dwa wierzchołki mogą być połączone krawędzią , której ciężar jest odwrotnie proporcjonalny do pewnej odległości między wierzchołkami. Zazwyczaj funkcja wagi będzie pewną odwrotnością mieszanki między ich odległością przestrzenną a ich wizualnym podobieństwem 8a w dwustronnym filtrowaniu).
Następnie, biorąc pod uwagę ten wykres, algorytmy segmentacji mogą szukać najlepszych klastrów wierzchołków, tj. Grup wierzchołków, które mają małą odległość wewnątrz grupy i dużą odległość poza grupą .
W metodzie cięcia znormalizowanego należy zachować szczególną ostrożność, aby uniknąć uprzedzeń wynikających z różnej wielkości populacji klastrów. Ponadto eksploracji grafów można uniknąć, obliczając SVD macierzy wag, znanej również jako macierz łączności w teorii grafów.