W przypadku rozwiązania, które jest wolne od skomplikowanych zależności zewnętrznych *, jest teraz readxl
:
Pakiet readxl ułatwia pobieranie danych z Excela do R. W porównaniu z wieloma istniejącymi pakietami (np. Gdata, xlsx, xlsReadWrite) readxl nie ma żadnych zewnętrznych zależności, więc jest łatwy w instalacji i obsłudze we wszystkich systemach operacyjnych. Jest przeznaczony do pracy z danymi tabelarycznymi przechowywanymi w jednym arkuszu.
Readxl obsługuje zarówno starszy format .xls, jak i nowoczesny format .xlsx oparty na XML. Obsługa .xls jest możliwa dzięki bibliotece libxls C, która usuwa wiele zawiłości bazowego formatu binarnego. Aby przeanalizować .xlsx, używamy biblioteki RapidXML C ++.
Można go zainstalować w następujący sposób:
install.packages("readxl")
lub
devtools::install_github("hadley/readxl")
Stosowanie
library(readxl)
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
read_excel("my-spreadsheet.xls", na = "NA")
* nie do końca prawda, wymaga Rcpp
pakietu , który z kolei wymaga Rtools (dla Windows) lub Xcode (dla OSX), które są zależnościami zewnętrznymi w stosunku do R. Ale nie wymagają żadnego majstrowania przy ścieżkach itp., więc jest to przewaga nad zależnościami Java i Perl.
Aktualizacja Jest teraz pakiet rexcel . Obiecuje to, że formatowanie, funkcje i wiele innych informacji programu Excel z pliku Excel i do R.
.csv
.