Pytania otagowane jako deep-learning

nowy obszar badań Machine Learning dotyczący technologii wykorzystywanych do uczenia się hierarchicznych reprezentacji danych, wykonywanych głównie w głębokich sieciach neuronowych (tj. sieciach z dwiema lub więcej ukrytymi warstwami), ale także z pewnymi probabilistycznymi modelami graficznymi.





2
Wizualizacja treningu głębokiej sieci neuronowej
Próbuję znaleźć odpowiednik diagramów Hintona dla sieci wielowarstwowych, aby wykreślić wagi podczas treningu. Przeszkolona sieć jest nieco podobna do Deep SRN, tj. Ma dużą liczbę macierzy wielokrotnych ciężaru, co sprawiłoby, że jednoczesny wykres kilku diagramów Hintona byłby mylący wizualnie. Czy ktoś zna dobry sposób na wizualizację procesu aktualizacji wagi dla …

5
Dlaczego dodanie warstwy przerywającej poprawia wydajność uczenia głębokiego / uczenia maszynowego, skoro ta rezygnacja tłumi niektóre neurony z modelu?
Jeśli usunięcie niektórych neuronów skutkuje lepszym działaniem modelu, dlaczego nie zastosować prostszej sieci neuronowej z mniejszą liczbą warstw i mniejszą liczbą neuronów? Po co budować większy, bardziej skomplikowany model na początku, a później go pomijać?


3
Dlaczego zwoje zawsze używają liczb nieparzystych jako filter_size
Jeśli spojrzymy na 90-99% artykułów opublikowanych za pomocą CNN (ConvNet). Zdecydowana większość z nich używa najczęściej używanych filtrów o liczbach nieparzystych : {1, 3, 5, 7}. Sytuacja ta może prowadzić do pewnych problemów: przy tych rozmiarach filtrów zwykle splot nie jest idealny z wypełnieniem 2 (wspólne wypełnienie), a niektóre krawędzie …

1
Co to jest warstwa konwergentna 1D w głębokim uczeniu się?
Dobrze rozumiem rolę i mechanizm warstw splotowych w Deep Learning do przetwarzania obrazów w przypadku implementacji 2D lub 3D - „po prostu” próbują uchwycić wzory 2D na obrazach (w przypadku 3 kanałów w przypadku 3D). Ale ostatnio wpadłem na warstwy splotowe 1D w kontekście przetwarzania języka naturalnego, co jest dla …

3
Czy do wnioskowania należy użyć procesora graficznego lub procesora?
Prowadzę głęboko uczącą się sieć neuronową, która została przeszkolona przez procesor graficzny. Chcę teraz wdrożyć to na wielu hostach w celu wnioskowania. Pytanie brzmi, jakie są warunki, aby zdecydować, czy należy używać procesorów graficznych, czy procesorów do wnioskowania? Dodając więcej szczegółów z komentarzy poniżej. Jestem nowy w tym, więc wskazówki …


2
Czy istnieje możliwość zmiany metryki używanej przez wywołanie zwrotne Early Stopping w Keras?
Podczas korzystania z wywołania zwrotnego wczesnego zatrzymania w Keras trening zatrzymuje się, gdy niektóre wskaźniki (zwykle utrata sprawdzania poprawności) nie rosną. Czy istnieje sposób na użycie innej miary (takiej jak precyzja, odwołanie, miara f) zamiast utraty sprawdzania poprawności? Wszystkie przykłady, które do tej pory widziałem, są podobne do tego: callbacks.EarlyStopping …

1
Wielozadaniowe uczenie się w Keras
Próbuję zaimplementować współdzielone warstwy w Keras. Widzę, że Keras ma keras.layers.concatenate, ale nie jestem pewien z dokumentacji dotyczącej jego użycia. Czy mogę go używać do tworzenia wielu współdzielonych warstw? Jaki byłby najlepszy sposób na wdrożenie prostej wspólnej sieci neuronowej, jak pokazano poniżej przy użyciu Keras? Zauważ, że wszystkie kształty warstw …

1
Powód kwadratowych obrazów w głębokim uczeniu się
Większość zaawansowanych modeli głębokiego uczenia, takich jak VGG, ResNet itp., Wymaga kwadratowych obrazów jako danych wejściowych, zwykle o rozmiarze piksela x .224 x 224224x224224x224 Czy istnieje powód, dla którego dane wejściowe muszą być w jednakowym kształcie, czy też mogę zbudować model konwekcyjny z powiedzmy (jeśli chcę na przykład rozpoznać twarz …

2
Utrata walidacji i dokładność pozostają stałe
Próbuję zaimplementować ten artykuł na zestawie obrazów medycznych. Robię to w Keras. Sieć zasadniczo składa się z 4 warstw konwekcyjnych i maksymalnych pul, po których następuje w pełni połączona warstwa i miękki klasyfikator maksymalny. O ile wiem, postępowałem zgodnie z architekturą wymienioną w artykule. Jednak utrata walidacji i dokładność pozostają …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.