Kogo śledzić na github, aby dowiedzieć się o najlepszych praktykach w analizie danych?


28

Pomocne jest przestudiowanie kodu analizy danych ekspertów. Ostatnio czytałem github i jest tam wiele osób udostępniających kod analizy danych. Obejmuje to kilka pakietów R (które są oczywiście dostępne bezpośrednio z CRAN), ale także kilka przykładów powtarzalnych badań, szczególnie przy użyciu R ( patrz lista R na github ).

  • Kim są dobrzy ludzie, którzy powinni śledzić na githubie, aby dowiedzieć się o najlepszych praktykach w analizie danych?
  • Opcjonalnie, jaki kod współdzielą i dlaczego jest to przydatne?

Odpowiedzi:


18

Hadley Wickham . Ma kilka eksploracyjnych projektów analizy danych na Githubie, na które można spojrzeć (np. „Data-baby-names”), a biorąc pod uwagę niesamowitość ggplot2 / plyr / reshape, mam domyślne (ale niewidome) zaufanie do jego najlepszych praktyki, szczególnie w odniesieniu do własnych paczek.

Dodatkowo masz wczesne informacje o innych projektach, nad którymi on pracuje!


5
(+1) Pracuje też nad zestawem samouczków na temat rozwoju Advanced R , bardzo przydatne!
chl

@Jeromy W rzeczywistości wydaje się, że jest to jedynie sposób na przygotowanie jego przyszłego podręcznika (sprawdź poprzednie tweety HW).
chl


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.