Architekturę wąskiego gardła definiujemy jako typ znaleziony w dokumencie ResNet, w którym [dwie warstwy konwekcyjne 3x3] są zastępowane przez [jedna konwekcja 1x1, jedna konwekcja 3x3 i kolejna warstwa konwekcyjna 1x1].
Rozumiem, że warstwy konwekcji 1x1 są używane jako forma redukcji wymiarów (i przywracania), co wyjaśniono w innym poście . Nie jestem jednak pewien, dlaczego ta struktura jest tak skuteczna jak oryginalny układ.
Niektóre dobre wyjaśnienia mogą obejmować: Jaką długość kroku stosuje się i na jakich warstwach? Jakie są przykładowe wymiary wejściowe i wyjściowe każdego modułu? W jaki sposób mapy obiektów 56x56 są przedstawione na powyższym schemacie? Czy 64-d odnosi się do liczby filtrów, dlaczego to się różni od filtrów 256-d? Ile wag lub FLOP używa się na każdej warstwie?
Każda dyskusja jest bardzo mile widziana!