Czy ktoś ma jakąkolwiek wiedzę na temat przepływów pracy do analizy danych związanych z niestandardowym pisaniem raportów? Przypadek użycia jest w zasadzie taki:
Klient zleca raport wykorzystujący analizę danych, np. Szacunkową liczbę ludności i powiązane mapy dla obszaru wodnego.
Analityk pobiera niektóre dane, munguje dane i zapisuje wynik (np. Dodając kolumnę dla populacji na jednostkę lub podzbiór danych w oparciu o granice dzielnicy).
Analityk analizuje dane utworzone w (2), zbliża się do celu, ale widzi, że potrzebuje więcej danych, i wraca do (1).
Powtarzaj płukanie, aż tabele i grafika spełniają QA / QC i zadowolą klienta.
Napisz raport zawierający tabele i grafikę.
W przyszłym roku szczęśliwy klient powraca i chce aktualizacji. Powinno to być tak proste, jak aktualizacja danych nadrzędnych poprzez nowe pobranie (np. Uzyskanie pozwolenia na budowę z ostatniego roku) i naciśnięcie przycisku „OBLICZ”, chyba że zmienią się specyfikacje.
W tej chwili po prostu uruchamiam katalog i ad-hoc, najlepiej jak potrafię. Chciałbym bardziej systematyczne podejście, więc mam nadzieję, że ktoś to wymyślił ... Używam kombinacji arkuszy kalkulacyjnych, SQL, ARCGIS, R i Uniksa.
Dzięki!
PS:
Poniżej znajduje się podstawowy plik Makefile, który sprawdza zależności od różnych pośrednich zestawów danych (w / .RData
przyrostek) i skryptów ( .R
przyrostek). Make używa znaczników czasu do sprawdzania zależności, więc jeśli zobaczysz touch ss07por.csv
, że ten plik jest nowszy niż wszystkie zależne od niego pliki / cele, i wykonaj podane skrypty, aby je odpowiednio zaktualizować. Jest to wciąż praca w toku, w tym krok do umieszczenia w bazie danych SQL i krok do szablonów takich jak Sweave. Pamiętaj, że w składni Make opiera się na tabulatorach, dlatego przed wycinaniem i wklejaniem przeczytaj instrukcję. Ciesz się i wyrażaj opinie!
http://www.gnu.org/software/make/manual/html_node/index.html#Top
R = / home / wsprague / R-2.9.2 / bin / R persondata.RData: ImportData.R ../../DATA/ss07por.csv Functions.R $ R --slave -f ImportData.R persondata.Munged.RData: MungeData.R persondata.RData Functions.R $ R --slave -f MungeData.R report.txt: TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f TabulateAndGraph.R> report.txt