W podstawowym uczeniu maszynowym uczymy się następujących „praktycznych zasad”:
a) rozmiar twoich danych powinien być co najmniej 10 razy większy niż rozmiar VC twojego zestawu hipotez.
b) sieć neuronowa z połączeniami N ma wymiar VC około N.
Kiedy więc sieć neuronowa dogłębnie ucząca się mówi, miliony jednostek, czy to oznacza, że powinniśmy mieć, powiedzmy, miliardy punktów danych? Czy możesz rzucić nieco światła na to?