Mam mniejsze testy jednostkowe, które używają małych fragmentów z prawdziwych zestawów danych. Chciałbym również przetestować mój program pod kątem pełnych zestawów danych z wielu powodów. Jedynym problemem jest to, że pojedynczy prawdziwy zestaw danych ma około ~ 5 GB. Nie znalazłem żadnych twardych liczb, które mogłyby przechowywać repozytoria Git, ale wydaje się, że to za dużo.
Rozwiązanie przyjęte przez mój zespół polega na tym, że projekt ma plik zawierający ścieżkę do podłączonego do sieci systemu plików, który przechowuje nasze dane testowe. Plik jest ignorowany przez Gita.
Wydaje mi się, że jest to niedoskonałe rozwiązanie z dwóch powodów. Gdy NAS nie działa, działa wolno lub jest niesprawny, nie możemy przeprowadzić pełnego testu. Drugim powodem jest to, że gdy ktoś po raz pierwszy klonuje repozytorium, testy jednostkowe kończą się niepowodzeniem, więc muszą dowiedzieć się, jak zamontować rzeczy o określonej nazwie i składni użytej do zbudowania pliku ścieżki testowej.
Więc moje pytanie jest dwojakie. Ile danych to za dużo danych, aby je zapisać w kontroli wersji?
Jaki jest lepszy sposób obsługi dużych ilości danych testowych?