Czytałem więc artykuł na temat SURF (Bay, Ess, Tuytelaars, Van Gool: Speeded-Up Robust Features (SURF) ) i nie mogę zrozumieć tego akapitu poniżej:
Ze względu na zastosowanie filtrów pudełkowych i zintegrowanych obrazów, nie musimy iteracyjnie stosować tego samego filtra do wydruku poprzednio filtrowanej warstwy, ale zamiast tego możemy zastosować filtry pudełkowe o dowolnym rozmiarze z dokładnie taką samą prędkością bezpośrednio na oryginalnym obrazie i nawet równolegle (chociaż ten ostatni nie jest tutaj wykorzystywany). Dlatego przestrzeń skali jest analizowana przez skalowanie w górę rozmiaru filtra zamiast iteracyjnego zmniejszania rozmiaru obrazu, rysunek 4.
This is figure 4 in question.
PS: Artykuł zawiera wyjaśnienie integralnego obrazu, jednak cała jego treść oparta jest na powyższym akapicie. Jeśli ktoś przeczytał ten artykuł, możesz krótko wspomnieć, co się tutaj dzieje. Całe matematyczne wyjaśnienie jest dość skomplikowane, aby mieć dobre zrozumienie, więc potrzebuję pomocy. Dzięki.
Edytuj, kilka problemów:
1.
Każda oktawa jest podzielona na stałą liczbę poziomów skali. Ze względu na dyskretną naturę całek, minimalna różnica skali między 2 kolejnymi skalami zależy od długości lo dodatnich lub ujemnych płatów częściowej pochodnej drugiego rzędu w kierunku pochodnej (x lub y), która jest ustawiona na jedna trzecia długości rozmiaru filtra. W przypadku filtra 9x9 ta długość lo wynosi 3. Dla dwóch kolejnych poziomów musimy zwiększyć ten rozmiar o co najmniej 2 piksele (jeden piksel z każdej strony), aby utrzymać nierówny rozmiar, a tym samym zapewnić obecność centralnego piksela . Powoduje to całkowity wzrost rozmiaru maski o 6 pikseli (patrz rysunek 5).
Figure 5
Nie mogłem zrozumieć linii w danym kontekście.
Dla dwóch kolejnych poziomów musimy zwiększyć ten rozmiar o co najmniej 2 piksele (jeden piksel z każdej strony), aby utrzymać nierówny rozmiar, a tym samym zapewnić obecność środkowego piksela.
Wiem, że starają się zrobić coś z długością obrazu, nawet jeśli próbują to zrobić dziwnie, tak aby istniał centralny piksel, który pozwoli im obliczyć maksymalny lub minimalny gradient pikseli. Jestem trochę niepewny co do kontekstowego znaczenia.
2)
Do obliczenia deskryptora używana jest falka Haara.
Jak niski jest region środkowy ale high.
3)
Jaka jest potrzeba posiadania filtra przybliżonego?
4. Nie mam problemu ze sposobem, w jaki odkryli rozmiar filtra. „Zrobili” coś empirycznie. Mam jednak dokuczliwy problem z tym fragmentem
Wyjściowy filtr 9x9, wprowadzony w poprzednim rozdziale, jest uważany za początkową warstwę skali, którą będziemy odnosić jako skalę s = 1,2 (przybliżenie pochodnych gaussowskich σ = 1,2).
Jak dowiedzieli się o wartości σ. Ponadto, w jaki sposób obliczenia skalowania wykonane pokazano na poniższym obrazku. Powodem, dla którego mówię o tym obrazie, jest to, że wartość s=1.2
ciągle się powtarza, bez wyraźnego określenia jego pochodzenia.
5.
Macierz Hesji reprezentowana w kategoriach L
splotu gradientu drugiego rzędu filtru Gaussa i obrazu.
Mówi się jednak, że „przybliżona” wyznacznik zawiera tylko terminy obejmujące filtr Gaussa drugiego rzędu.
Wartość w
wynosi:
Moje pytanie, dlaczego wyznacznik jest obliczany w ten sposób powyżej i jaki jest związek między przybliżoną macierzą Hesji i Hesji.