Małe (prawdziwe) zbiory danych do dawania przykładów w klasie?


43

Nauczając klasę wprowadzającą, znani nauczyciele mają tendencję do wymyślania pewnych liczb i historii w celu zilustrowania metody, której nauczają.

Wolałbym opowiedzieć prawdziwą historię z prawdziwymi liczbami. Historie te muszą jednak odnosić się do bardzo małego zestawu danych, który umożliwia ręczne obliczenia.

Wszelkie sugestie dotyczące takich zestawów danych będą bardzo mile widziane.

Kilka przykładowych tematów dla małych zestawów danych:

  • korelacja / regresja (podstawowa)
  • ANOVA (1/2 sposobu)
  • testy z / t - jedna / dwie niesparowane próbki
  • porównania proporcji - tabele dwukierunkowe / wielostronne

potrafisz zdefiniować „malutki”? Czy obliczenia „ręczne” obejmują użycie kalkulatora?
David LeBauer

Cześć David - kalkulator jest w porządku - ale chodzi o to, żeby nie mieć zbyt wielu liczb (ponieważ wszystkie muszą być zapisane na tablicy)
Tal Galili

Odpowiedzi:


26

Biblioteka danych i historii to „internetowa biblioteka plików danych i historii, które ilustrują użycie podstawowych metod statystycznych”.

Ta witryna wydaje się mieć to, czego potrzebujesz, i możesz wyszukiwać w niej określone zestawy danych.


Cześć David - strona, do której linkujesz, jest naprawdę świetna - dziękuję.
Tal Galili

Usługa obecnie niedostępna (stan na kwiecień 2016 r.)
Felipe Almeida

@FelipeAlmeida Właśnie wszedłem na stronę; sprawdź ponownie, być może na innym komputerze / urządzeniu
David LeBauer 17.04.16

@DavidLeBauer, czy próbowałeś kliknąć „listę wszystkich tematów”, a następnie wybrać jedną z metod? zobacz ten link tutaj
Felipe Almeida

1
@FelipeAlmeida Rozumiem. Rozmawiałem z opiekunem strony, który powiedział: „Poszukaj nowego, bardziej nowoczesnego i znacznie lepszego DASL już wkrótce na dasl.datadesk.com”.
David LeBauer,

23

Jest książka zatytułowana „Handbook of Small Datasets” autorstwa DJ Handa, F. Daly, AD Lunn, KJ McConway i E. Ostrowskiego. Departament Statystyki w NCSU są elektronicznie pisał zestawy danych z tej książki tutaj .

Powyższa strona internetowa podaje tylko dane; musisz przeczytać książkę, aby uzyskać historię za liczbami, to znaczy każdą historię wykraczającą poza to, co można uzyskać z tytułu zbioru danych. Ale są małe i są prawdziwe .


To tylko odpowiedni rozmiar. Książkę możesz wyświetlić, wyszukując „Podręcznik małych zestawów danych” w Google Scholar - możesz przeglądać jej części w książkach Google.
Felipe Almeida

Podany link jest zepsuty. Zaktualizuj link. Dzięki
MYaseen208

13

W przypadku tabel dwukierunkowych podoba mi się dane dotyczące płci i przeżycia pasażerów Titanica:

       | Alive  Dead | Total
-------+-------------+------
Female | 308    154  |  462
Male   | 142    709  |  851
-------+-------------+------
Total  | 450    863  | 1313

Na podstawie tych danych można omówić takie rzeczy, jak test chi-kwadrat dla niezależności i miary przydziału, na przykład współczynnik względny i iloraz szans. Na przykład pasażerki-kobiety były ~ 4 razy bardziej narażone na przeżycie niż pasażerowie-mężczyźni. Jednocześnie pasażerowie płci męskiej byli ~ 2,5 razy bardziej narażeni na śmierć niż pasażerki płci żeńskiej. Jednak iloraz szans na przeżycie / śmierć wynosi zawsze 10.


Dobry pomysł Wolfgang, nie myślałem o tym.
Tal Galili

(Opublikuj wiki społeczności zgodnie ze wszystkimi innymi odpowiedziami).
Glen_b



4

Prawdopodobnie tak oczywista odpowiedź, że tak naprawdę nie trzeba jej wymieniać, ale dla korelacji lub regresji liniowej kwartet Anscombe jest logicznym wyborem. Chociaż nie jest to prawdziwa historia z prawdziwymi danymi, myślę, że jest to tak prosty przykład, że rozsądnie pasowałby do twoich kryteriów.


Dobry przykład Andy - nauczyłem się dziś czegoś nowego :)
Tal Galili


2

Ładny artykuł zatytułowany Resource Discovery for Teaching Statistics rzucił światło na ten temat.


Właśnie skończyłem czytać większość artykułów (przejrzałem kilka części) - to naprawdę dobra ocena sytuacji. Ciekawie będzie zobaczyć, jak to się rozwinie w przyszłości ...
Tal Galili,

2
Czy to możliwe, że możesz tutaj dodać kluczowe punkty lub podać streszczenie? Link może w pewnym momencie zginąć, a także pomoże czytelnikom dowiedzieć się, czy chcą kontynuować link bez konieczności klikania go.
gung - Przywróć Monikę

1

https://tuvalabs.com

Jestem pewien, że już dawno znalazłeś to, czego szukałeś, ale dla każdego, kto spotyka wątek - TuvaLabs jest dobrym źródłem zestawów danych dla Classrooms. Wyszukuje zestawy danych, historię, opis, małe ćwiczenia i możliwości wizualizacji, a także można żądać zestawów danych na ten temat.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.