Czytam wiele artykułów na temat: Wykrywanie obiektów, Rozpoznawanie obiektów, Segmentacja obiektów, Segmentacja obrazu i Semantyczna segmentacja obrazu i oto moje wnioski, które mogą być nieprawdziwe:
Rozpoznawanie obiektów: Na danym obrazie musisz wykryć wszystkie obiekty (ograniczona klasa obiektów zależy od zestawu danych), zlokalizuj je za pomocą ramki granicznej i oznacz tę ramkę etykietą. Na poniższym obrazku zobaczysz proste wyjście z najnowocześniejszego rozpoznawania obiektów.
Wykrywanie obiektów: to jest jak rozpoznawanie obiektów, ale w tym zadaniu masz tylko dwie klasy klasyfikacji obiektów, co oznacza ramki ograniczające obiekty i ramki nie będące obiektami. Na przykład Wykrywanie samochodu: musisz wykryć wszystkie samochody na danym obrazie z ich obwiedniami.
Segmentacja obiektów: Podobnie jak rozpoznawanie obiektów rozpoznasz wszystkie obiekty na obrazie, ale twój wynik powinien pokazywać obiekt klasyfikujący piksele obrazu.
Segmentacja obrazu: Podczas segmentacji obrazu segmentujesz regiony obrazu. Twoje wyniki nie będą oznaczać segmentów i regionu obrazu, które spójne ze sobą powinny znajdować się w tym samym segmencie. Wyodrębnianie super pikseli z obrazu jest przykładem tego zadania lub segmentacji tła pierwszego planu.
Segmentacja semantyczna: w segmentacji semantycznej musisz oznaczyć każdy piksel klasą obiektów (samochód, osoba, pies, ...) i obiektami nieprzemakalnymi (woda, niebo, droga, ...). Innymi słowy, w segmentacji semantycznej oznaczysz każdy region obrazu.