Kontekst: W odpowiedzi na wcześniejsze pytanie dotyczące powtarzalnych badań Jake napisał
Jednym z problemów, który odkryliśmy podczas tworzenia naszego archiwum JASA, była zmiana wersji i domyślnych pakietów CRAN. Tak więc w tym archiwum uwzględniamy również wersje używanych pakietów. System oparty na winietach prawdopodobnie się zepsuje, gdy ludzie zmienią swoje paczki (nie jestem pewien, jak dołączyć dodatkowe paczki do paczki, którą jest Kompendium).
Wreszcie zastanawiam się, co robić, gdy zmienia się sam R. Czy istnieją sposoby na stworzenie, powiedzmy, maszyny wirtualnej, która odtwarza całe środowisko obliczeniowe używane na papierze, tak aby maszyna wirtualna nie była ogromna?
Pytanie:
- Jakie są dobre strategie zapewniające powtarzalność analizy danych w przyszłości (powiedzmy pięć, dziesięć lub dwadzieścia lat po publikacji)?
- W szczególności, jakie są dobre strategie maksymalizacji bieżącej odtwarzalności przy użyciu Sweave i R?
Wydaje się, że jest to związane z kwestią zapewnienia, że projekt odtwarzalnej analizy danych będzie działał na czyimś komputerze z nieco innymi wartościami domyślnymi, pakietami itp.