Kotwice wyjaśnione
Kotwice
Na razie zignoruj fantazyjne określenie „piramidy pól referencyjnych”, kotwice są niczym innym jak prostokątami o stałej wielkości, które mają być dostarczane do Regionalnej Sieci Propozycji. Zakotwiczenia są zdefiniowane na ostatniej splotowej mapie obiektów, co oznacza, że jest ich , ale odpowiadają obrazowi. Dla każdej kotwicy wówczas RPN przewiduje prawdopodobieństwo ogólnego umieszczenia obiektu i czterech współrzędnych korekcyjnych w celu przesunięcia i zmiany rozmiaru kotwicy do właściwej pozycji. Ale w jaki sposób geometria kotwic ma coś wspólnego z RPN? (H.fae a t u r e m a p∗W.fae a t u r e m a p) ∗ ( k )
Kotwice faktycznie pojawiają się w funkcji Loss
Podczas szkolenia RPN najpierw do każdej kotwicy przypisywana jest etykieta klasy binarnej. Zakotwiczenia z przecięciem przez Unię ( IoU ) pokrywają się z polem prawdziwości gruntu, wyższym niż określony próg, mają przypisaną etykietę dodatnią (podobnie zakotwiczenia z IoU mniejszym niż określony próg będą oznaczone jako Negatywne). Te etykiety są następnie używane do obliczania funkcji utraty:
p jest wyjściem głowicy klasyfikacyjnej RPN, który określa prawdopodobieństwo zakotwiczenia zawierającego obiekt. W przypadku kotwic oznaczonych jako Negatywne nie dochodzi do strat w wyniku regresji - , etykieta prawdziwości gruntu wynosi zero. Innymi słowy, sieć nie przejmuje się wyjściowymi współrzędnymi dla ujemnych kotwic i jest szczęśliwa, dopóki poprawnie je klasyfikuje. W przypadku kotwic dodatnich brana jest pod uwagę utrata regresji. jest wyjściem głowy regresji RPN, wektorem reprezentującym 4 sparametryzowane współrzędne przewidywanej ramki granicznej. Parametryzacja zależy od geometrii kotwy i wygląda następująco:p∗t
gdzie i h oznaczają współrzędne środkowe ramki oraz jej szerokość i wysokość. Zmienne i dotyczą odpowiednio pola przewidywanego, pola zakotwiczenia i pola prawdziwości podłoża (podobnie dla ).x , y, w ,x ,xza,x∗y, w , h
Zauważ też, że kotwice bez etykiety nie są klasyfikowane ani przekształcane, a RPM po prostu wyrzuca je z obliczeń. Po wykonaniu zadania RPN i wygenerowaniu propozycji reszta jest bardzo podobna do szybkich R-CNN.