Nawiasem mówiąc, pytanie dotyczące korzystania z arkuszy kalkulacyjnych Google wzbudziło przeciwstawne (stąd ciekawe) opinie na ten temat: Czy niektórzy z was używają arkusza kalkulacyjnego Dokumentów Google do prowadzenia i udostępniania swojej pracy statystycznej innym?
Mam na myśli starszą pracę, która nie wydawała się tak pesymistyczna, ale jest ona tylko nieznacznie cytowana we wspomnianym artykule: Keeling i Pavur, Badanie porównawcze dotyczące niezawodności dziewięciu pakietów oprogramowania statystycznego (CSDA 2007 51: 3811). Ale teraz znalazłem twój na moim dysku twardym. W 2008 r. Pojawił się także problem specjalny, patrz sekcja specjalna dotycząca programu Microsoft Excel 2007 , a ostatnio w Journal of Statistics Software: O numerycznej dokładności arkuszy kalkulacyjnych .
Myślę, że to długotrwała debata, a znajdziesz różne artykuły / opinie na temat niezawodności Excela w obliczeniach statystycznych. Myślę, że istnieją różne poziomy dyskusji (jaki rodzaj analizy planujesz zrobić, czy polegasz na wewnętrznym rozwiązaniu, czy istnieją nieliniowe terminy, które wchodzą w dany model itp.), I mogą pojawić się źródła niedokładności liczbowych w wyniku prawidłowych błędów obliczeniowych lub problemów z wyborem projektu ; jest to dobrze podsumowane w
M. Altman, J. Gill i MP McDonald,
Problemy numeryczne w obliczeniach statystycznych dla naukowca społecznego , Wiley, 2004.
Teraz do analizy danych eksploracyjnych istnieją różne alternatywy, które zapewniają ulepszone możliwości wizualizacji, grafikę wielowymiarową i dynamiczną, np. GGobi - ale zobacz powiązane wątki na tej wiki.
Ale wyraźnie pierwszy punkt, który podałeś, dotyczy innego problemu (IMO), a mianowicie wykorzystania arkusza kalkulacyjnego do obsługi dużego zestawu danych: po prostu nie jest możliwe zaimportowanie dużego pliku csv do programu Excel (mam na myśli dane genomowe, ale dotyczy innych rodzajów danych wielowymiarowych). Nie został zbudowany w tym celu.
R
SAS).