Próbuję znaleźć metodę wykrywania ludzi za pomocą tylko jednej kamery 3 metry nad ziemią. To jest ramka zwrócona przez aparat:
AKTUALIZACJA: Test wideo -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi
Aby to zrobić, najpierw rozumiem, że muszę przeprowadzić segmentację tła pierwszego planu. To jest łatwa część.
Za pomocą maski pierwszego planu jestem w stanie wykonać proste operacje, takie jak transformacja Hougha, aby znaleźć kręgi, ale w ten sposób wykrywa tylko 60% głów, w tym wiele fałszywych alarmów.
Mógłbym użyć kilku innych prostych technik, takich jak segmentacja kolorów, ale odkryłem, że głowy ludzi są bardzo różne od góry ze względu na ich fryzurę, kolor, ilość włosów, ...
Inną opcją, którą o tym myślałem, jest możliwość korzystania z deskryptorów HOG lub funkcji podobnych do Haara, ale potrzebowałbym obszernej bazy danych osób widzianych z góry, aby trenować modele. Nie znalazłem czegoś takiego.
Myślałem, że będzie to bardzo powtarzający się problem, ale nie mogę znaleźć wiele na ten temat w literaturze ani w Internecie. Będziemy wdzięczni za pomoc w rozwiązaniu tego zadania :-)
AKTUALIZACJA: Aby uzyskać więcej informacji, celem jest wdrożenie jakiejś ogólnej metody śledzenia przepływu pieszych. Pierwszy prototyp zostanie przetestowany w centrum handlowym.