Jakie są najczęstsze algorytmy adaptacyjnego progowania?


38

Adaptacyjne progowanie zostało omówione w kilku wcześniejszych pytaniach:

Adaptacyjne wartości progowe dla segmentacji wątroby za pomocą Matlaba

Jakie są najlepsze algorytmy progowania obrazu dokumentu w tym przykładzie?

Oczywiście istnieje wiele algorytmów dla progów adaptacyjnych. Chcę wiedzieć, które z nich są najbardziej skuteczne i przydatne.

Których algorytmów adaptacyjnych używałeś najczęściej i dla jakiej aplikacji; jak możesz wybrać ten algorytm?

Odpowiedzi:


24

Nie sądzę, aby moja była kompletną odpowiedzią, ale dam ci to, co wiem, a ponieważ jest to witryna edytowana przez społeczność, mam nadzieję, że ktoś wkrótce udzieli mi bezpłatnej odpowiedzi :)

Adaptacyjne metody progowe to te, które nie wykorzystują tego samego progu na całym obrazie .

Jednak w przypadku niektórych prostszych zastosowań czasem wystarczy wybrać próg za pomocą metody inteligentniejszej niż najprostsza metoda iteracyjna . Metoda Otsu jest popularną metodą progową, która zakłada, że ​​obraz zawiera dwie klasy pikseli - pierwszy plan i tło oraz ma bimodalny histogram . Następnie próbuje zminimalizować ich łączny spread (wariancja wewnątrz klasy).

Najprostsze algorytmy, które można uznać za naprawdę adaptacyjne metody progowe, to te, które dzielą obraz na siatkę komórek, a następnie stosują prostą metodę progową (np. Iteracyjną lub metodę Otsu) na każdej komórce, traktując ją jako osobny obraz (i przypuszczalnie dwumodalny histogram). Jeśli nie można przekroczyć progu obrazu podrzędnego, można zastosować próg z jednej z sąsiednich komórek.

Alternatywnym podejściem do znalezienia lokalnego progu jest statystyczna analiza wartości intensywności lokalnego sąsiedztwa każdego piksela . Próg jest inny dla każdego piksela i obliczany na podstawie jego lokalnego sąsiedztwa ( możliwa jest mediana, średnia i inne opcje). Istnieje funkcja tego rodzaju metod zawartych w bibliotece OpenCV w cv::adaptiveThresholdingfunkcji.

Znalazłem inną podobną metodę o nazwie Bradley Local Thresholding . Bada także sąsiedztwo każdego piksela, ustawiając jasność na czarny, jeśli jasność pikseli jest t procent niższa niż średnia jasność otaczających pikseli. Odpowiedni artykuł można znaleźć tutaj .

Ta odpowiedź na przepełnienie stosu wspomina lokalną (adaptacyjną) metodę progową o nazwie Niblack, ale wcześniej o niej nie słyszałem.

Wreszcie, jest metoda, której użyłem w jednym z moich wcześniejszych mniejszych projektów, zwanej Próg Obrazu przez Optymalizację Minimax Wariacji . Jest to metoda iteracyjna, polegająca na optymalizacji funkcji energii, która jest nieliniową kombinacją dwóch składników. Jeden element ma na celu obliczenie progu na podstawie pozycji najsilniejszych zmian intensywności na obrazie. Drugi element ma na celu wygładzenie progu w obszarach granicznych (obiektowych). Okazało się dość dobre na obrazach instrumentów analogowych (różne cieniowanie i odbicie od szkła / plastiku), ale wymagało starannego wyboru liczby iteracji.

Późna edycja : zainspirowany komentarzem do tej odpowiedzi . Jest jeszcze jeden sposób na obejście nierównych warunków oświetleniowych. Napiszę tutaj o jasnych obiektach na ciemnym tle, ale to samo rozumowanie można zastosować, jeśli sytuacja jest odwrotna. Przekrocz próg białej transformacji obrazu ze stałym progiem zamiast oryginalnego obrazu . Biały cylinder obrazu to tylko różnica między obrazem a jego otwieraniem . Jako dalsze wyjaśnienie pozwólcie, że zaoferuję cytat z P. Soille: Analiza obrazu morfologicznego :fγ(f)

Otwarcie oryginalnego obrazu dużym kwadratowym SE usuwa wszystkie istotne struktury obrazu, ale zachowuje funkcję oświetlenia. Biały cylinder oryginalnego obrazu lub odjęcie funkcji oświetlenia od oryginalnego obrazu powoduje wyświetlenie obrazu o jednorodnym oświetleniu.


14

Artykuł zawierający porównanie wielu metod progowania można znaleźć tutaj:

  • M. Sezgin, B. Sankur - Badanie technik progowania obrazu i ilościowej oceny wydajności, Journal of Electronic Imaging, 2004 - pdf

Oto kolejny artykuł oceniający metody binaryzacji:

  • P. Stathis, E. Kavallieratou i N. Papamarkos - Technika oceny dla algorytmów binaryzacji, Journal of Universal Computer Science, 2008, - pdf

Adaptacyjna metoda binaryzacji, którą zastosowałem w moim ostatnim projekcie, wykorzystuje obrazy integralne do szybkiego obliczania funkcji progowej stosowanej przez metodę Sauvola. Metodę Sauvola opisano w:

  • J. Sauvola i M. Pietikainen, Adaptacyjna binaryzacja obrazu dokumentu, Pattern Recognition 33, 2000. - pdf

Modyfikacja wykorzystująca zintegrowane obrazy zapewniające 20-krotne przyspieszenie (zgodnie z dokumentem) jest opisana w tym artykule:

  • F. Shafait, D. Keysers i TM Breuel, Skuteczne wdrażanie lokalnych technik adaptacyjnego progowania za pomocą zintegrowanych obrazów, Rozpoznawanie i wyszukiwanie dokumentów XV, 2008 - pdf

To tylko dokumenty, których użyłem przy wyborze metody binaryzacji dla mojego projektu (do znalezienia tekstu w obrazach). Nie jestem ekspertem, więc nie mogę powiedzieć, która metoda jest najlepsza dla której aplikacji.


6

Odpowiedź na to pytanie jest bardzo dobra z różnych perspektyw, a ja chcę tylko podsumować moje doświadczenie, a także podkreślić niektóre problemy związane z adaptacyjną binaryzacją.

Adaptacyjna binaryzacja może być podzielona na trzy kategorie:

1) Metoda globalna: za pomocą tej metody szacuje się najpierw tło obrazu; następnie za pomocą informacji w tle generowany jest znormalizowany obraz. Następnie stosuje się globalną metodę binaryzacji.

2) Metoda oparta na łatce: jak wskazuje nazwa, metoda oparta na łatce wykona łatkę binarną po łatce. Przy każdej łatce szacuje się binaryzację za pomocą globalnej metody binaryzacji. Następnie wykonuje się pewne przetwarzanie końcowe, aby upewnić się, że próg binaryzacji w sąsiednich łatach ma płynne przejście.

3) Metoda ruchomego okna: dzięki tej metodzie binaryzacja odbywa się piksel po pikselu. Przesuwane okno jest skonfigurowane do obliczania statystyki pikseli w oknie, a na podstawie statystyk obliczany jest próg dla centralnego piksela w oknie.

Bardzo trudno jest powiedzieć, która metoda jest najlepsza, ponieważ zależy to od zastosowania. Kiedy myślisz o adaptacyjnej binaryzacji, nie zapomnij rozważyć następujących pytań:

1) ustawianie parametrów: czy metoda ma procedurę automatycznego ustawiania parametrów? Jak możemy ustawić parametry bardzo dobrze, aby działało w większości przypadków?

2) jakie jest kryterium uzasadnienia dobrej adaptacyjnej binaryzacji? W wielu przypadkach różnica między różnymi metodami binaryzacji jest naprawdę niewielka. Jednak niewielka różnica może ostatecznie doprowadzić do dużej różnicy.

3) Czy binaryzacja może działać w określonych sytuacjach? Załóżmy na przykład, że celem adaptacyjnej binaryzacji jest wyodrębnienie obiektów z czarnego tła, czy binaryzacja może automatycznie dostosować się do tej sytuacji? Lub wice wizowa.

4) metody adaptacyjne mają tendencję do koncentrowania się tylko na konfiguracjach lokalnych, dlatego wynik binarny nie jest optymalizowany. Na przykład słynna metoda Sauvola wygeneruje pusty w środku obiekt, jeśli zoptymalizowany obiekt jest znacznie większy niż ruchome okno. Czy twoja metoda adaptacyjna może pokonać to ograniczenie?

5) przetwarzanie wstępne. Dobra binaryzacja powinna również obejmować poufne przetwarzanie obrazu. Jeśli obraz jest zbyt rozmazany, może automatycznie dostosować parametry algorytmu lub wywołać wstępne przetwarzanie, aby uniknąć złej binaryzacji.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.