Jestem w trakcie przygotowywania się do wprowadzenia kursu wprowadzającego na temat danych z wykorzystaniem języka programowania R. Moją publicznością są studenci studiów licencjackich specjalizujących się w tematyce biznesowej. Typowy student biznesu nie ma żadnego doświadczenia w programowaniu komputerowym, ale wziął kilka klas, które korzystają z Excela.
Osobiście bardzo dobrze czuję się w języku R (lub innych językach programowania), ponieważ specjalizowałem się w informatyce. Mam jednak wrażenie, że wielu moich uczniów będzie uważało na naukę języka programowania, ponieważ może to im wydawać się trudne.
Znam trochę Excela i wierzę, że chociaż Excel może być przydatny do prostych analiz danych, konieczne jest, aby uczniowie nauczyli się poważnego języka programowania dla analiz danych (np. R lub Python). Jak przekonać siebie i studentów, że Excel nie jest wystarczający dla poważnego studenta biznesu studiującego naukę danych i że konieczne jest, aby nauczyli się programowania?
Edytowane w odpowiedzi na komentarz
Oto niektóre z tematów, które omówię:
- Przetwarzanie i czyszczenie danych
- Jak manipulować tabelą danych, np. Wybrać podzbiór wierszy (filtr), dodać nowe zmienne (mutować), posortować wiersze według kolumn
- SQL łączy się przy użyciu pakietu dplyr
- Jak narysować wykresy (wykresy punktowe , wykresy słupkowe, histogramy itp.) Za pomocą pakietu ggplot2
- Jak oszacować i zinterpretować modele statystyczne, takie jak regresja liniowa, regresja logistyczna, drzewa klasyfikacyjne i k-najbliżsi sąsiedzi
Ponieważ nie znam zbyt dobrze programu Excel, nie wiem, czy wszystkie te zadania można łatwo wykonać w programie Excel.