Widzę wiele możliwych problemów z tym podejściem. Mówię tutaj z własnego doświadczenia z ulepszania systemu liczenia pieszych z bardzo podobnym podejściem, więc nie chcę zniechęcać. Przeciwnie, chciałbym ostrzec cię przed możliwymi przeszkodami, które możesz pokonać, aby zbudować dokładny i solidny system.
Po pierwsze, odejmowanie tła zakłada, że interesujące obiekty zawsze będą się poruszać, a obiekty, których nie chcesz liczyć, pozostaną całkowicie nieruchome. Z pewnością może tak być w twoim scenariuszu, ale nadal jest to bardzo ograniczające założenie. Odkryłem też, że odejmowanie tła jest bardzo wrażliwe na zmiany oświetlenia (zgadzam się z geometrikal).
Zachowaj ostrożność przy przyjmowaniu założenia, że jedna kropelka = jedna osoba , nawet jeśli uważasz, że twoje środowisko jest dobrze kontrolowane. Zdarzało się zbyt często, że obiekty blob odpowiadające ludziom nie były wykrywane, ponieważ się nie poruszały lub były zbyt małe, więc zostały usunięte przez erozję lub niektóre kryteria progowe (i wierz mi, nie chcesz wchodzić w „ dostosuj progi, aż wszystko zadziała „pułapka. To nie działa;)). Może się również zdarzyć, że jedna kropla odpowiada dwóm osobom idącym razem lub jednej osobie niosącej bagaż. Lub pies. Więc nie rób sprytnych założeń na temat obiektów blob.
Na szczęście, skoro wspominasz, że używasz LBP do wykrywania osób , myślę, że jesteś na dobrej drodze, aby nie popełnić błędów w powyższym akapicie. Nie mogę jednak komentować skuteczności LBP w szczególności. Przeczytałem również, że HOG (histogram gradientów) jest najnowocześniejszą metodą wykrywania ludzi, patrz Histogramy zorientowanych gradientów do wykrywania ludzi .
Mój ostatni problem związany jest z używaniem Camshift . Opiera się na histogramach kolorów, więc sam w sobie działa dobrze podczas śledzenia pojedynczego obiektu, który można łatwo odróżnić po kolorze, pod warunkiem, że okno śledzenia jest wystarczająco duże i nie ma okluzji ani nagłych zmian. Ale gdy tylko będziesz musiał wyśledzić wiele celów, które mogą mieć bardzo podobne opisy kolorów i które będą się zbliżać bardzo blisko siebie, po prostu nie możesz obejść się bez algorytmu, który w jakiś sposób pozwala ci zachować wiele hipotez. Może to być filtr cząstek lub szkielet, taki jak MCMCDA (Markov Chain Monte Carlo Data Association, patrz Markov Chain Monte Carlo Data Association do śledzenia wielu celów). Moje doświadczenie z używaniem Meanshift podczas śledzenia wielu obiektów to wszystko, co nie powinno się zdarzyć ze śledzeniem: utrata śladu, mylące cele, utrwalanie w tle itp. Przeczytaj trochę o problemach ze śledzeniem wielu obiektów i powiązaniem danych, może to być serce liczenia wielu osób w końcu (mówię „może być”, ponieważ twoim celem jest liczenie braku śledzenia, więc nie odrzucam całkowicie możliwości jakiegoś sprytnego podejścia, które liczy się bez śledzenia ...)
Moja ostatnia rada brzmi: istnieje tylko tyle można zrobić z danym podejściu , a ty będziesz potrzebować bardziej wyszukane rzeczy, aby osiągnąć lepszą wydajność (więc nie zgadzam się z user36624 w tym zakresie). Może to oznaczać zmianę fragmentu algorytmu o coś potężniejszego lub całkowitą zmianę architektury. Oczywiście musisz wiedzieć, które fantazyjne rzeczy są dla Ciebie naprawdę przydatne. Istnieją publikacje, które próbują rozwiązać problem w sposób zgodny z zasadami, podczas gdy inne po prostu opracowują algorytm dla danego zestawu danych i oczekują, że wyszkolisz klasyfikatora, który tak naprawdę nie jest odpowiedni do danego problemu, wymagając jednocześnie dostosuj też kilka progów. Liczenie ludzi totrwające badania, więc nie oczekuj, że wszystko przyjdzie łatwo. Staraj się uczyć rzeczy nieco przekraczających twoje możliwości, a następnie rób to raz po raz ...
Przyjmuję do wiadomości, że nie zaproponowałem żadnych rozwiązań, a zamiast tego wskazałem tylko na błędy w twoim podejściu (wszystkie pochodzą z mojego własnego doświadczenia). Aby uzyskać inspirację, zalecamy przeczytanie ostatnich badań, na przykład Stabilne śledzenie wielu celów w wideo nadzoru w czasie rzeczywistym . Powodzenia!