Jakie oprogramowanie statystyczne nadaje się do nauczania licencjackich wstępnych kursów statystyki w naukach społecznych?


11

Szukam pakietu oprogramowania statystycznego, którego mogę użyć we wprowadzającym kursie do programu badań nauk społecznych. Studenci nie mają wcześniejszej wiedzy statystycznej ani doświadczenia w językach programowania. Celem jest zapoznanie ich z podstawowymi pojęciami statystycznymi (jako średnie, wariancja, suma kwadratów, wartości p, ... i wreszcie regresja liniowa) oraz umożliwienie im samodzielnego przeprowadzania podstawowych analiz na przykładowych zestawach danych. Kurs powinien dotyczyć uczenia się pojęć poprzez tworzenie statystyk, a nie zapamiętywanie formuł (chociaż myślę, że formuły są ważne).

Dlatego szukam alternatywy dla zwykłego oprogramowania opartego na składni (jako normalny R) lub oprogramowania typu wskaż i kliknij (jako SPSS lub Rcmdr). Oprogramowanie powinno być łatwe do nauczenia i powinno mieć przejrzysty graficzny interfejs użytkownika, który wizualizuje zestawy danych i oferuje standardowe wykresy i tabele. Najlepiej byłoby, gdyby wizualizował wszystkie etapy analizy (np. Czytanie i manipulowanie danymi, obliczanie miar opisowych, tworzenie tabel i wykresów opisowych, obliczanie miar wnioskowania, wykreślanie wykresów wnioskowania, eksport do raportu).

Czy masz sugestie (otwartego lub bezpłatnego) oprogramowania statystycznego, które jest odpowiednie do uczenia się i wykonywania pierwszej statystyki?

EDYCJA
Dzięki za sugestie. Zajrzałem do gretl i dwóch innych programów, które znalazłem podczas mojego internetowego zapytania: RapidMiner i Statistics Lab . [1]
Odkryłem, że gretlinterfejs i wyniki są bardziej przejrzyste i skoncentrowane niż np. Rcmdr, SPSS lub Stata. Dlatego z mojego punktu widzenia jest to dobrze wykwalifikowane narzędzie do rozpoczynania nauczania statystyki.
Jednak schematy blokowe GUI RapidMineriStatistical Labzrobiło na mnie wrażenie, gdy wizualizują pojedyncze etapy analizy statystycznej (zaczynając od ładowania danych). Myślę, że może to być pomocne dla wielu uczniów, którzy mają trudności ze zwykłym skupieniem się na wyjaśnieniach matematycznych. Oczywiście RapidMiner wydaje mi się zbyt obciążony funkcjami, menu i przyciskami dla początkujących, podczas gdy Laboratorium statystyczne jest znacznie bardziej skoncentrowane. Dużym plusem Laboratorium Statystycznego jest podobny do konsoli „Kalkulator R” z „Kreatorem kodu R”, który pomaga w tworzeniu prawdziwej składni języka R, ponieważ laboratorium statystyczne korzysta z Rjego obliczeń.
W końcu postanowiłem zacząć od Laboratorium Statystycznego w pierwszym semestrze, wprowadzając podstawowe pojęcia i przejść do RStudio (i Rcmdr) w drugim semestrze.

[1]: Gnumeric, SciPy, Scilab, GNU Octave i podobne wydają mi się mniej ukierunkowane na nauki społeczne.


8
@Matthias: Myślę, że jeśli twoi uczniowie przybywają / celują z / na dziedzinę nauk społecznych, nauczenie ich R jako pierwszego kroku w statystyce jest przesadą. Większość z nich będzie miała problemy z koncepcją konsoli, poleceń, składni itp. I poświęcisz więcej czasu na „koncepcje programowania” (co to jest „funkcja”, „pętla” itp.) Niż „statystyki”. Opieram to na wcześniejszych doświadczeniach, kiedy robiłem samouczki dla Stats 101 w dziale Soc.Science; ludzie pominęli punkt wykładu, ponieważ bardziej skupili się na tym, by R dla nich pracował, niż w rzeczywistości badając swoje dane.
usεr11852

1
@ user11852: Być może masz rację, ale szkoda, że ​​liceum wysyłają uczniów bez żadnej wiedzy na temat programowania. Lub uniwersytety, które dopuszczają tę lukę. Nie powinno być żadnego studenta przychodzącego na zajęcia uniwersyteckie, który nie wiedziałby, czym jest pętla lub funkcja. Opóźnianie ekspozycji popycha problem w inne miejsce.
curious_cat

2
@ user11852: Inną, mniej smaczną opcją może być wydział Satistics, aby nalegać, aby zajęcia „Stats 101 for Social Sciences” były wymagane przez pewne doświadczenie programistyczne lub zajęcia naprawcze dotyczące programowania. W dzisiejszych czasach, gdy prawie wszystkie przedmioty są tak mocno obciążone obliczeniami, naprawdę nie ma powodu, dla którego Programowanie-101 nie powinno być pierwszą klasą, jaką wszyscy biorą.
curious_cat

6
Za to, co jest warte, z powodzeniem wykorzystałem R na moim kursie wprowadzającym do nauk politycznych. Użyłem RStudio . Miałem też cotygodniowe „laboratoria”, w których pozwalałem studentom współpracować przy małych zadaniach, podczas gdy chodziłem i odpowiadałem na pytania. Dzięki dobrze skomentowanemu przykładowemu kodowi uczniowie mieli się dobrze i wcale nie narzekali. W rzeczywistości narzekali dużo mniej na R niż w poprzednim semestrze, kiedy korzystałem ze Staty. Ponieważ Stata nie jest wolna, uczniowie musieli przychodzić na godziny laboratoryjne, aby wykonywać swoją pracę - nienawidzili tego.
Jason Morgan

6
Myślę, że R w połączeniu z RStudio może być doskonałym podejściem. W przeciwieństwie do systemów menu stanowi także podwaliny dla powtarzalnej praktyki badawczej. Radziłbym podać kilka szablonów kodu, które uczniowie mogą załadować do RStudio z Internetu (RStudio ułatwia to) i pozwolić uczniom na zmianę nazw zmiennych i modeli statystycznych w zależności od potrzeb.
Frank Harrell

Odpowiedzi:


12

Może Gretl? http://gretl.sourceforge.net/

Jest darmowy i używany na naszej uczelni do statystyk licencjackich.


9
+1. Doskonała sugestia. Zawsze uważałem GUI Gretla za intuicyjne i rzeczowe, a informacje zwrotne, które zapewnia, są dokładne i bez zbędnych dodatków, które zniechęcałyby niektórych mniej „technicznych” studentów. Dodatkowo jest darmowy, dobrze udokumentowany i ma konsolę R, jeśli ktoś chce zobaczyć coś „głębszego”.
usεr11852

8

Unikałbym większości „znanych” rzeczy, MatLab , Maple , Mathematica , JMP , SAS lub Minitab , ponieważ kiedy twoi studenci kończą szkołę, muszą płacić tysiące dolarów rocznie, aby korzystać z nich profesjonalnie. Każda firma ma zwykle swoje ulubione narzędzie, a jeśli nauczysz je narzędzia, za które ich firma nie zapłaci, ich zestaw umiejętności zostanie zmarnowany. Nie podobają mi się również zastrzeżone biblioteki - uczą użytkowników, jak naciskać przyciski, a jeśli użytkownik chce iść gdzie indziej (JMP lub cokolwiek innego), nie ma możliwości przeniesienia nauki.

Python inclding SciPy / NumPy jest całkiem niezły. Jest to oprogramowanie typu open source i dobrze obsługiwane. Ma łatwą do opanowania gramatykę. Nadal jest interpretowany, więc nie krzyczy szybko, ale jeśli nie znają skryptów ani arkuszy kalkulacyjnych, jest znacznie szybszy, niż by kiedykolwiek potrzebował. PythonXY to dobra wersja, ma dobre biblioteki i wsparcie. Podoba mi się również to, że programowanie przez GUI jest możliwe. Budowanie samodzielnych aplikacji w systemie Windows jest trochę trudne, ale prawdopodobnie będzie wyższe niż poziom twoich uczniów. (edytuj) Sage and Cythonznacznie poprawić ofertę wartości Pythona. Interfejs i użyteczność zostały znacznie ulepszone. Skompilowany kod, który jest 1000 razy szybszy niż całkiem dobry kod interpretowany, brzmi dla mnie świetnie (lub niesamowicie). EDIT: miałem trochę zabawy przy użyciu Anaconda (aka Conda) rozkładów, a są one również bardzo proste w użyciu.

Nie jestem wielkim fanem Perla . To jest trochę przestarzałe. Chodzi o analizowanie i przetwarzanie tekstu bardziej niż matematyki / nauk ścisłych. Nie zrozum mnie źle, może robić matematykę / naukę, ale jeśli znasz VBA, MSWord może robić matematykę / naukę. Bycie w stanie to nie to samo, co przede wszystkim, mieć określoną pracę.

Lubię R , nawet jeśli nie, ponieważ jest agresywnie rozwijany przez wykwalifikowanych doktorów matematyki / statystyki. Oznacza to, że nawet jeśli gramatyka może być niepoprawna, będzie mieć biblioteki, które są aktualne i bezbłędne. (Ogólnie)

Excel nie jest złym początkiem. Gdy poznasz jeden arkusz kalkulacyjny, korzystanie z innego arkusza będzie łatwiejsze. W otoczeniu biznesowym prawie każda firma ma biuro MicroSloth, więc Excel nie jest złym pomysłem. Nie podoba mi się ich skryptowanie, ale to tylko preferencja, nadal mogę go używać. Kosztuje około 150 dolarów amerykańskich w porównaniu do 5000 dolarów amerykańskich w przypadku niektórych innych programów, więc jego koszt wejścia dla zwykłych ludzi jest bardziej rozsądny.

Język skryptowy JMP jest obcy. Nie tłumaczy się na inne oprogramowanie (nieSAS). Trzymaj się od tego z daleka. Jedyną możliwą do wykorzystania cechą tego języka jest to, że może (w pewnym ograniczonym sensie) uruchomić kod „R”. Jeśli kodujesz w „R”, użyj po prostu „R” i „RStudio”.

Nie korzystałem z MathCADa, więc nie mogę mówić o jego znaczeniu. Myślę, że jest to bardziej symboliczne, mniej o importowaniu danych zewnętrznych. Jak dotąd jest tańszy. To nie jest darmowe i otwarte. Obiekt nie jest tłumaczony na obiekt w innym języku. ( EDYCJA ) Również w tej kategorii znajduje się EES , na który nie jestem pod wrażeniem poza bardzo wąskim oknem użytkowania.

EDYCJA : LabVIEW pod wrażeniem mnie trochę . Jest wystarczająco prosty w użyciu, że kilka godzin może sprawić, że ktoś będzie w stanie. Działa naprawdę szybko, jak dosłownie 1000x szybciej niż MatLab dla dosłownie tego samego kodu ( MathScript ). Jeśli masz jakieś ciężkie podnoszenie, warto trochę rozważyć. Kosztuje to pieniądze, ale coś w okolicach 1/5 konwencjonalnego dużego żelaza.

Powodzenia

EDYCJA: Nie użyłbym Statystycznego LAboratory, ponieważ nawet jeśli wybierzesz „angielski” dla języka, pojawi się on w języku niemieckim i nie odinstaluje się w systemie Windows 7. Obie słabości administracyjne sprawiają, że nie mogę tego zrobić. Nie mogę go obsługiwać, a gdy próbowałem go usunąć, nie powiodło się.

Próbując metodą prób i błędów odkryłem ustawienie menu, aby wyświetlać je w języku angielskim. Wydaje się, że jest to stosunkowo prosty (a zatem użyteczny i spójny) interfejs do niektórych bibliotek R do przetwarzania i wyświetlania danych. Będę musiał przyjrzeć się temu bliżej, więc w tym momencie „jury wciąż nie istnieje”.

EDYTUJ więcej:

-> Tutaj <- to zabawny link do całej innej dyskusji na temat narzędzi i stanowisk roboczych.


2
Istnieje również RPy rpy.sourceforge.net , R jako biblioteka dla Pythona, więc masz aktualne, sprawdzone i wolne od błędów aspekty R z syntaktyczną prostotą Pythona.
Ghillie Dhu,

1
„uczą użytkowników, jak naciskać przyciski, a jeśli użytkownik chce iść gdzie indziej (JMP lub cokolwiek innego), nie ma możliwości przeniesienia nauki”. SAS, zastrzeżony program, nie trenuje szczególnie dobrze w zakresie „naciskania przycisków”, a problemy z przenoszeniem między różnymi językami nie są cechą samego oprogramowania. Cholera, byłem bardziej w domu, jadąc z SysStat do JMP niż z Python do R.
Fomite

@Epigrad - Cały czas wyłączam mózg inżynierów. Dziesiątki i dziesiątki ludzi. Cieszę się, że znalazłeś przydatność do tego, ale mocno oczekuję, że jesteś odstraszaczem, a ogólne doświadczenie szkody nie zmienia się zasadniczo.
EngrStudent

@EngrStudent: Dziękujemy za próbę przeprowadzenia Laboratorium Statystycznego! Ustawienie menu dla języka angielskiego jest rzeczywiście nieintuicyjne, ale po jego ustawieniu nie napotkałem więcej problemów z językiem. Niestety nie mogę uruchomić „Kreatora wykresów R”, chociaż normalny wykres R działa poprawnie, jeśli wstawię jakiś kod R. Dlatego dam moim uczniom kilka przykładowych fragmentów kodu do stworzenia podstawowej grafiki. Może wcześniej przestawię się na RStudio ...
non-numeric_argument

1

Możesz spróbować użyć Gnumeric, bardzo przemyślanego arkusza kalkulacyjnego, jest też arkusz kalkulacyjny Open Office. Pod warunkiem wyjaśnienia pułapek korzystania z arkuszy kalkulacyjnych, zwłaszcza Excela, po studiach w ich późniejszym praktycznym życiu mogą nie mieć luksusu czegoś takiego jak SPSS, ale nadal mogą uzyskać użyteczną usługę z tych bezpłatnych produktów, które nie są zbyt wymagające matematyki i umiejętności programowania . Wiele środowisk biurowych domyślnie zawiera program Excel.

Spójrz na:

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Statystyki i Excel 2007

i szukaj podobnych referencji, takich jak

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=pl#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Badanie porównawcze wiarygodności dziewięciu statystycznych pakietów oprogramowania. Statystyka obliczeniowa i analiza danych, 51, 3811–3831.


1

Byłem CalEst . Licencja jest tania, podobnie jak 10 dolarów i zapewnia zarówno obliczenia / grafikę, jak i świetną symulację / ćwiczenia dla studentów do ćwiczeń. Co więcej, na swojej stronie internetowej mają pewne narzędzia, głównie w dystrybucjach, które mogą ci się przydać.


Ta odpowiedź jest nieco krótka. Czy mógłbyś dowiedzieć się więcej o tym, dlaczego zaproponujesz to oprogramowanie i jakie zalety ma ono w porównaniu z konkurencją?
kjetil b halvorsen

1

Zaczęliśmy używać Rguroo. To oprogramowanie zostało niedawno wydane. Jest oparty na języku R, ale nie jest wymagana znajomość kodowania R. Jest to również aplikacja internetowa, więc wystarczy zalogować się w przeglądarce. Moi uczniowie mogą zapisać swoją pracę na dowolnym etapie i wrócić, aby ukończyć swoją pracę. Graficzny interfejs użytkownika jest bardzo intuicyjny, a wyniki wyglądają świetnie.


0

Używamy wersji beta Rguroo na naszych wstępnych kursach statystycznych na California State University w Fullerton przez ostatnie trzy lata. Teraz (sierpień 2019 r.) Wydali oficjalną wersję, patrz https://Rguroo.com. Jest to aplikacja internetowa do statystyk, która działa w dowolnej przeglądarce. To oprogramowanie jest przeznaczone do nauczania i oferuje demo jeden na jednego oraz szkolenia dla wykładowców; po prostu wyślij e-mail lub zadzwoń, aby umówić się na prezentację. Oprogramowanie działa R w tle, ale nie musisz znać R, wszystko wskazuje i kliknij. Ma wiele wspaniałych funkcji, w tym szczegółowe dane wyjściowe, świetne narzędzia graficzne, kalkulator prawdopodobieństwa i narzędzia do symulacji. Szczególnie podoba mi się funkcja odtwarzalności, w której możesz zapisać swoją pracę na dowolnym etapie i wrócić i kontynuować tam, gdzie ją przerwałeś. Możesz także dzielić się swoją pracą ze studentami za pośrednictwem plików RGR. Podsumowując ... jest świetny i nadal go używamy.


0

Osobiście używam oprogramowania DataMelt do nauczania statystyki. Jest bardzo dobrze udokumentowany, ma tutoriale, książki i wiele przykładów do obejrzenia. Ważne jest również to, że można wyszukać dowolny przykład i uzyskać rozsądną odpowiedź (w Javadoc i we fragmentach kodu). Studenci mogą nauczyć się nie tylko języka Python (który jest domyślnym językiem programowania), ale także sposobu kodowania metod statystycznych w Javie. Moim zdaniem jest to znacząca siła: uczniowie nie muszą uczyć się bardzo specjalistycznego języka „statystycznego”, takiego jak R-stat. Mogą również uczyć się języka Java w tym samym czasie, co może otworzyć wiele możliwości, jeśli zdecydują się przejść do branży.


-1

Pojawiło się nowe oprogramowanie o nazwie Rguroo, które jest aplikacją internetową. Jest bardzo wygodny w użyciu, ponieważ nie wymaga pobierania ani instalacji. Rguroo ma silnik R, ale jego użycie nie wymaga kodowania R, ponieważ umożliwia wykorzystanie mocy R za pomocą interfejsu graficznego „wskaż i kliknij”. Każda analiza jest zapisywalna i odtwarzalna. W ciągu ostatnich trzech lat korzystaliśmy z tego oprogramowania na naszych wstępnych i średniozaawansowanych kursach statystycznych. W tym momencie jest darmowy i możesz założyć konto na www.Rguroo.com. Na podstawie informacji, które posiadam, pozostanie darmowy dla wszystkich wydziałów i będzie mieć rozsądną roczną opłatę abonamentową, gdzieś pomiędzy 10 a 20 dolarów, dla studentów.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.