Niedawno przeczytałem w pełni sieci konwergentne dla segmentacji semantycznej autorstwa Jonathana Longa, Evana Shelhamera, Trevora Darrella. Nie rozumiem, co robią „warstwy dekonwolucyjne” / jak działają. Odpowiednia część to 3.3 Upsampling jest konwertowanym krokiem wstecz Innym sposobem łączenia gruboziarnistych wyjść z gęstymi pikselami jest interpolacja. Na przykład prosta interpolacja dwuliniowa oblicza …
Niedawno przeczytałem komentarz Yan LeCuns na temat zwojów 1x1 : W sieciach konwekcyjnych nie ma czegoś takiego jak „w pełni połączone warstwy”. Istnieją tylko warstwy splotu z jądrem splotu 1x1 i pełną tabelą połączeń. Jest to zbyt rzadko rozumiany fakt, że ConvNets nie muszą mieć danych wejściowych o stałym rozmiarze. …
Chciałbym użyć sieci neuronowej do klasyfikacji obrazów. Zacznę od wstępnie przeszkolonego CaffeNet i wyszkolę go do mojej aplikacji. Jak przygotować obrazy wejściowe? W tym przypadku wszystkie obrazy są tego samego obiektu, ale z różnymi odmianami (pomyśl: kontrola jakości). Są w nieco różnych skalach / rozdzielczościach / odległościach / warunkach oświetleniowych …
To pytanie sprowadza się do „jak dokładnie działają warstwy splotu . Załóżmy, że mam obraz w skali szarości . Obraz ma jeden kanał. W pierwszej warstwie stosuję splot 3 × 3 z filtrami k 1 i wypełnieniem. Następnie mam kolejną warstwę splotu z 5 x 5 zwojami i filtrami k …
Często słyszę, jak ludzie mówią, dlaczego splotowe sieci neuronowe są nadal słabo poznane. Czy wiadomo, dlaczego splotowe sieci neuronowe zawsze uczą się coraz bardziej wyrafinowanych funkcji w miarę wchodzenia na kolejne warstwy? Co spowodowało, że stworzyli taki zestaw cech i czy dotyczyłoby to również innych typów głębokich sieci neuronowych?
Podczas uczenia sieci neuronowych jeden hiperparametr ma rozmiar minibatchu. Najczęściej wybierane są 32, 64 i 128 elementów na jedną partię. Czy istnieją jakieś zasady / wytyczne dotyczące wielkości mini-partii? Jakieś publikacje, które badają wpływ na szkolenie?
Papier Idąc głębiej ze zwojów opisuje GoogleNet który zawiera oryginalne moduły powstania: Zmiana na początek v2 polegała na tym, że zastąpiły one splot 5x5 dwoma kolejnymi splotami 3x3 i zastosowały pule: Jaka jest różnica między Inception v2 a Inception v3?
Jestem całkiem nowy w sieciach neuronowych, ale całkiem przyzwoicie rozumiem algebrę liniową i matematykę splotu. Próbuję zrozumieć przykładowy kod znajdujący się w różnych miejscach w sieci do szkolenia splotowego NN Keras z danymi MNIST do rozpoznawania cyfr. Oczekuję, że kiedy utworzę warstwę splotową, będę musiał określić filtr lub zestaw filtrów …
Tworzę plik corr()df z oryginalnego pliku df. corr()Df wyszedł 70 x 70 i to jest niemożliwe, aby wyobrazić sobie mapę cieplną ... sns.heatmap(df). Jeśli spróbuję wyświetlić corr = df.corr(), tabela nie pasuje do ekranu i widzę wszystkie korelacje. Czy jest to sposób na wydrukowanie całości dfbez względu na jej rozmiar …
Gram trochę z konwekcjami. W szczególności korzystam z zestawu danych kaggle koty kontra psy, który składa się z 25 000 obrazów oznaczonych jako kot lub pies (po 12500 każdego). Udało mi się osiągnąć około 85% dokładności klasyfikacji na moim zestawie testowym, jednak wyznaczyłem sobie cel osiągnięcia 90% dokładności. Moim głównym …
Mam następujący CNN: Zaczynam od obrazu wejściowego o rozmiarze 5x5 Następnie stosuję splot za pomocą jądra 2x2 i stride = 1, który tworzy mapę cech o rozmiarze 4x4. Następnie stosuję maksymalne łączenie 2x2 z krokiem = 2, co zmniejsza mapę obiektów do rozmiaru 2x2. Następnie stosuję sigmoid logistyczny. Następnie jedna …
Jeśli spojrzę na jedno z wielu źródeł klas Imagenet w Internecie, nie mogę znaleźć żadnej klasy związanej z ludźmi (i nie, żniwiarz nie jest kimś, kto zbiera, ale to, co znałem jako długie nogi tatusia, rodzaj pająk :-). Jak to możliwe? Chciałbym mieć co najmniej spodziewali się personlekcje, a nawet …
Mam małe pytanie cząstkowe do tego pytania . Rozumiem, że podczas wstecznej propagacji przez warstwę maksymalnej puli gradient jest kierowany z powrotem w taki sposób, że neuron w poprzedniej warstwie, która została wybrana jako maksymalna, otrzymuje cały gradient. Nie jestem w 100% pewien, w jaki sposób gradient w następnej warstwie …
Próbuję zrozumieć ten artykuł i nie jestem pewien, co to jest próbkowanie binarne. Czy ktoś może to wyjaśnić na wysokim szczeblu? https://arxiv.org/abs/1606.00915
Jeśli spojrzymy na 90-99% artykułów opublikowanych za pomocą CNN (ConvNet). Zdecydowana większość z nich używa najczęściej używanych filtrów o liczbach nieparzystych : {1, 3, 5, 7}. Sytuacja ta może prowadzić do pewnych problemów: przy tych rozmiarach filtrów zwykle splot nie jest idealny z wypełnieniem 2 (wspólne wypełnienie), a niektóre krawędzie …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.