W teorii skali przestrzeni reprezentacja skali przestrzeni sygnału (w przypadku obrazu , d = 2 ), jest wyrażony jako: L ( x , y ; t ) = g ( x , y ; t ) ∗ f ( x , y ) gdzie g ( x , jest jądrem gaussowskim o parametrze t, a ∗ jest splotem. Zmieniającparametr t otrzymujemy mniej lub bardziej wygładzony obraz. W rezultacie grubsza reprezentacja (parametr t ) nie będzie zawierać małych obiektów ani szumu.
Chodzi przede wszystkim o znalezienie sposobu na wykrywanie funkcji niezmiennej w skali, prawda? W przypadku niektórych zdjęć w zmniejszonej kopii funkcje takie jak punkty kluczowe zostaną poprawnie wykryte, nawet jeśli rozmiar jest inny, bez znalezienia innych punktów kluczowych szumu.
W pracy wykorzystują znormalizowane pochodne . δ ξ , γ - n o r m = t γ / 2 δ x . Jakie jest znaczenie użycia znormalizowanej pochodnej γ , w jaki sposób pomaga ona w niezmienności skali?
Z tego obrazu możemy zobaczyć, że w pobliżu tych samych pozycji znaleziono różne punkty kluczowe (różnej wielkości). Jak to możliwe?
Jeśli potrafisz wyjaśnić krok po kroku algorytm wykrywania funkcji niezmiennej w skali, byłoby to świetne. Co się właściwie dzieje? Pochodne mogą być przyjmowane przez lub t . Krople można wykryć, biorąc pochodną L przez zmienne ( x , y ) . W jaki sposób pomaga pochodna t ?
Artykuł, który czytałem to: Wykrywanie funkcji z automatycznym wyborem skali