Na moim laptopie Dell Core i7 - 16 GB RAM - 4GB 960m GPU pracuję nad projektem klasyfikacji obrazów CT płuc przy użyciu 3d CNN. Używam wersji procesora tensorflow. Obrazy są przygotowywane jako tablica liczb numpy (25,50,50).
Mój model CNN miał 2 warstwy konwekcyjne, dwie warstwy maxpool, jedną warstwę FC i warstwę wyjściową. Dzięki tej architekturze mogłem trenować model z około (5000 do 6000) próbek. Po dodaniu kolejnych warstw mój model ma teraz 6 warstw konwekcyjnych, 3 warstwy maksymalnej puli, FC i warstwę wyjściową. Mój problem polega na zmianie architektury z nieco więcej niż 1000 próbek, moja pamięć się zapełnia i pojawia się błąd pamięci. Próbowałem tworzyć mniejsze partie, ale za każdym razem otrzymywałem ten sam błąd. Mam dwa pytania:
Dlaczego poprzez dodanie większej liczby warstw model potrzebuje więcej pamięci?
Czy istnieje sposób na poradzenie sobie z tego rodzaju problemem?