Czy są jakieś algorytmy widzenia komputerowego specjalnie ukierunkowane na obrazy głębokości?


9

Przyglądałem się algorytmom wykrywania markerów do zastosowania z aplikacją opartą na kinektach, a większość pracy, jaką udało mi się znaleźć, koncentruje się oczywiście na wykrywaniu cech na „normalnych” obrazach.

Jednak sprzęt kinect zapewnia (zasadniczo po dostosowaniu) 11-bitową głębokość na piksel.

Ten obraz głębokości zawiera również różne artefakty wizualne z cieni rzucanych wokół krawędzi obiektów (patrz na przykład mocna czarna ramka w tym filmie http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

Podczas gdy niektóre tradycyjne techniki widzenia maszynowego (np. Wykrywanie krawędzi) działają dobrze, inne nie, i wydaje się, że w sieci jest niewiele informacji na ten temat.

Jako prosty przykład użycie wartości głębokości sprawia, że ​​wykrycie orientacji bloku znacznika po jego zlokalizowaniu jest banalne.

Czy ktoś widział jakieś dyskusje / dokumenty / itp. Dotyczące przetwarzania obrazu głębi w celu wykrycia funkcji?

Czy ktoś może polecić dobry algorytm do wykrywania znaczników „głębokości” (efektywnie bloków origami zamiast drukowanych znaczników czarno-białych)?

Do tej pory robiłem eksperymenty adhoc przy użyciu opencv do przetwarzania obrazów, ale nie jest to wystarczająco stabilne ani wystarczająco szybkie.

Jeśli łączysz się z komercyjnym produktem do widzenia maszynowego bez jakiejś próby, w odpowiedzi podaj, dlaczego uważasz, że jest to właściwe.


Jest na to mnóstwo dokumentów i programów. Niestety nie mogę odpowiedzieć bardziej szczegółowo, przy niskiej przepustowości. Zobacz aplikację RGBDemo, zawiera ona rozpoznawanie obiektów. Ponadto, PointCloud Library (PCL), ROS, OpenCV, dla oprogramowania i prawdopodobnie Google Scholar dla dokumentów. Wspominasz, że OpenCV nie jest dla ciebie zadowalający, ale PCL i RGBDemo mogą być.

Nie szukam implementacji wersji demonstracyjnej, która pokazuje kinect, ani niektórych wersji demonstracyjnych na PC, które pokazują, jak wygenerować model 3d z kinecta lub zestawu narzędzi do przetwarzania obrazu (np. Opencv). Szukam algorytmów do rozpoznawania funkcji na podstawie obrazów głębi.

RGBDemo implementuje te algorytmy. Przeczytaj kod lub odniesienia do kodu.

Odpowiedzi:


8

Moim ulubionym deskryptorem funkcji 2.5D / 3D do rejestracji i rozpoznawania jest obraz wirowania (oryginalny papier + więcej szczegółów w pracy doktorskiej i oprogramowanie dostępne na CMU).

Inne najnowsze osiągnięcia (wszystkie przeszukiwalne on-line odpowiednie algorytmy) obejmują: 3D-Sift, Histogram cech szybkiego punktu, Normalne wyrównane cechy promieniowe (NARF), Deskryptory jądra głębokości. Starsze metody po prostu wykorzystywały właściwości powierzchni, takie jak krzywizna i krawędzie, do identyfikowania łat regionu.

Który jest najlepszy Zależy od tego, co chcesz znaleźć, niezmienności punktu widzenia, dodatkowego bałaganu itp.


7

Zrozumiałeś wszystkie kluczowe słowa, jestem zaskoczony, że tak naprawdę nie znalazłeś żadnych powiązanych artykułów podczas szukania materiału.

Na szczęście mam dostęp do biblioteki cyfrowej IEEE Xplore. Nie potrzebowałem wcześniej żadnego z tych konkretnych algorytmów, ale wygląda to bardzo interesująco, więc oto kilka wyników szybkiego wyszukiwania, które moim zdaniem mogą być odpowiednie (nie oceniaj ich według tytułów, spójrz na ich streszczenia):

Niestety nie sądzę, abyś mógł uzyskać dostęp do któregokolwiek z tych artykułów za darmo, przynajmniej nie poprzez bibliotekę IEEE Xplore. Jeśli nie masz dostępu, prawdopodobnie możesz poradzić sobie z Google Scholar , a istnieją pewne bezpłatne papierowe bazy danych (korzystałem z bazy danych Mendeley, gdy jeszcze nie miałem dostępu do IEEE). Ponadto, po prostu przeglądanie części abstrakcyjnych lub losowych części artykułu czasami przynosi pewne rezultaty (możesz natknąć się na prawie ukończone, wcześniej opublikowane wersje artykułu).

Zapytania użyłem znaleźć wspomniane dokumenty były: 3D obrazu , głębia obrazu , Kinect . Możesz także wrzucić przetwarzanie podczas wyszukiwania pierwszych dwóch zapytań.

Mam nadzieję, że to pomoże niektórym! Jest mi przykro, że nie mogę się bardziej zagłębić w temat, brzmi naprawdę interesująco.



@mankoff tylko ze streszczenia, po prostu widzę, że praca koncentruje się na śledzeniu, i wydaje się, że koncentruje się na wykorzystaniu bezpośrednich informacji przy niewielkim wykrywaniu funkcji. Ale potem czytam streszczenie, więc nie jestem pewien.

Przejrzyj tytuły artykułów wystarczy znaleźć pliki PDF dla kilku z tych artykułów. Innym dobrym źródłem jest CiteSeer: citeseerx.ist.psu.edu/index Dziękujemy za listę artykułów!
Rethunk
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.