Jest mało prawdopodobne, aby znacznie wykraczało poza bezpośrednie działania związane z gromadzeniem danych.
Jakość obecnych wyjść GAN (od 2017 r.) Nie będzie wystarczająco wysoka. Obrazy tworzone przez GAN są zwykle małe i mogą zawierać nietypowe / niejednoznaczne szczegóły i dziwne zniekształcenia. W dokumencie, który połączyłeś, obrazy generowane przez system ze zdania mają wiarygodne bloki koloru, biorąc pod uwagę przedmiot, ale bez zdania, które określa, czego się spodziewać, większość z nich nie jest rozpoznawalna jako żaden konkretny temat.
Sieci GAN o mniej ambitnym celu niż generowanie obrazów ze zdań (co pomimo mojej powyższej krytyki, naprawdę niezwykły wyczyn IMO) powinny wytwarzać obrazy bardziej realistyczne. Ale ich zakres będzie mniejszy i prawdopodobnie nie będzie zawierać pożądanego typu obrazu. Ponadto zazwyczaj rozmiar wyjściowy jest niewielki, np. 64 x 64 lub 128 x 128 *, i nadal istnieje wystarczająco dużo zniekształceń i niejednoznaczności, że oryginalne zdjęcia z prawdziwej ziemi byłyby zdecydowanie lepsze.
Sam GAN jest ograniczony dostępną biblioteką szkoleniową - nie będzie dobrze, jeśli spróbujesz wygenerować obrazy poza zakresem jego danych szkoleniowych. Wyniki przedstawione w artykule badawczym skupiają się oczywiście na dziedzinie dostarczonej przez dane szkoleniowe. Ale nie możesz po prostu wprowadzić żadnego zdania do tego modelu i oczekiwać rezultatu, który byłby przydatny w innym miejscu.
Jeśli znajdziesz GAN, który został przeszkolony w zakresie odpowiedniego zestawu danych dla twojego problemu, najprawdopodobniej lepiej będzie spróbować źródła tych samych danych bezpośrednio dla twojego projektu.
Jeśli napotykasz problem z ograniczonymi prawdami naziemnymi, być może lepszym podejściem do korzystania z GAN byłoby użycie wstępnie wyszkolonego klasyfikatora, takiego jak VGG-19 lub Inception v5, zastąpienie kilku ostatnich w pełni połączonych warstw i dobrze dostosuj go do swoich danych. Oto przykład zrobienia tego przy użyciu biblioteki Keras w Pythonie - inne przykłady można znaleźć w wynikach wyszukiwania takich jak „dopracowanie klasyfikatora obrazów CNN”.
* Najnowocześniejsze sieci GAN poprawiły się, odkąd opublikowałem tę odpowiedź. Zespół badawczy z Nvidii odniósł niezwykły sukces, tworząc 1024 x 1024 fotorealistycznych obrazów . Nie zmienia to jednak innych punktów mojej odpowiedzi. Sieci GAN nie są wiarygodnym źródłem obrazów do zadań klasyfikacji obrazów, z wyjątkiem może zadań podrzędnych tego, na czym GAN został już przeszkolony i jest w stanie generować warunkowo (a może bardziej ogólnie, aby dostarczyć dane źródłowe dla „innych” kategorii w klasyfikatory).