Używam SAS
od 15 lat i zacząłem używać R
poważnie w ciągu ostatnich 6 miesięcy, a niektóre z nich majstrowały przez kilka lat przed tym. Z punktu widzenia programowania, R
manipulowanie danymi odbywa się bezpośrednio, nie ma odpowiednika DATA
ani PROC SQL
procedur, ponieważ nie są one potrzebne (ta ostatnia jest bardziej wydajna, SAS
gdy jest dużo manipulacji danymi z zewnętrznych źródeł danych, np. Danych administracyjnych). Oznacza to, że teraz rozumiem, że manipulowanie danymi jest szybsze R
i wymaga znacznie mniej kodu.
Głównym problemem, jaki napotkałem, jest pamięć. Nie wszystkie pakiety R zezwalają na WEIGHT
specyfikacje typów, więc jeśli masz SAS
zestawy danych ze zmiennymi używanymi w FREQ
lub REPLICATE
instrukcjach, możesz mieć problemy. Patrzyłem na pakiety ff
i bigmemory
w R, ale nie wydają się one być kompatybilne ze wszystkimi pakietami R, więc jeśli masz bardzo duże zestawy danych, które wymagają analiz, które są stosunkowo rzadkie i zostały zagregowane, możesz mieć problemy z pamięcią.
W przypadku automatyzacji, jeśli masz SAS macros
, powinieneś być w stanie zaprogramować ekwiwalent R
i uruchomić jako partię.
Do kodowania w R
używałem Notepad++
i Ustawianie języka R
, i jestem teraz odkrywanie radości R Studio
. Oba te produkty są bezpłatne i zawierają znaczniki językowe, takie jak ulepszony SAS
graficzny interfejs użytkownika (do tej pory używałem tylko ekranu składni SAS
).
Istnieje strona internetowa i powiązana książka dla osób zmieniających się z SAS
na R
. Uznałem je za przydatne przy próbach przetłumaczenia niektórych SAS
poleceń R
.
Aktualizacja: jedną rzeczą, która zawiozła mnie orzechy, kiedy zbliża się do R
jest to, że R
nie przyjmuje wszystko to zestaw danych ( data frame
w R
żargonie), ponieważ nie jest to pakiet statystyczny w taki sposób, że SAS
, SPSS
, Stata
, itp są. Na przykład zajęło mi trochę czasu, aby if
instrukcje działały, ponieważ ciągle otrzymywałem pomoc dla if
instrukcji z wektorami (lub może macierzami), podczas gdy potrzebowałem if
instrukcji, która działała data frames
. Tak więc strony pomocy prawdopodobnie powinny być czytane dokładniej niż normalnie, ponieważ musisz sprawdzić, czy polecenie, które chcesz wykonać, będzie działać z typem obiektu danych, który masz.
To, co wciąż doprowadza mnie do szału, kiedy uczę się nowego R
polecenia (np. Metody analizy w paczce), polega na tym, że pomoc dla poleceń często nie jest całkowicie samodzielna. Przejdę do strony pomocy, aby spróbować nauczyć się polecenia i często ...
w nim zawartych notatek dotyczących użytkowania . Czasami próba ustalenia, co może lub powinna pójść tam, gdzie ...
jest, doprowadziła mnie do pętli rekurencyjnej. Względna zwięzłość notatek pomocy, z SAS
których pochodzą szczegółowe przykłady składni i przykładów roboczych z wyjaśnieniem badania w tym przykładzie, była dość dużym szokiem.