Pytania otagowane jako eda

EDA to skrót od „Exploratory data analysis”. Opracowany przez Tukey w przeciwieństwie do Confirmatory Data Analysis lub CDA (formalne testowanie hipotez). EDA zazwyczaj zajmuje się opisywaniem danych liczbowo i graficznie, aby ułatwić zrozumienie danych i uzyskać nowe spostrzeżenia.

24
Praktyczne zasady dla „nowoczesnych” statystyk
Lubię książkę G van Belle'a na temat statystycznych reguł kciuka oraz, w mniejszym stopniu, typowych błędów w statystyce (i jak ich uniknąć) autorstwa Phillipa I Gooda i Jamesa W. Hardina. Odnoszą się do typowych problemów podczas interpretacji wyników badań eksperymentalnych i obserwacyjnych oraz dostarczają praktycznych zaleceń dotyczących wnioskowania statystycznego lub …

6
Czy jest jakiś dobry powód, aby używać PCA zamiast EFA? Czy PCA może również zastąpić analizę czynnikową?
W niektórych dyscyplinach PCA (analiza głównego składnika) jest systematycznie stosowana bez żadnego uzasadnienia, a PCA i EFA (analiza czynników eksploracyjnych) są uważane za synonimy. Dlatego ostatnio użyłem PCA do analizy wyników badania walidacji skali (21 pozycji na 7-punktowej skali Likerta, zakładając, że składają się 3 czynniki po 7 pozycji każdy), …


8
Graficzny przegląd danych (podsumowanie) w R
Jestem pewien, że wcześniej spotkałem taką funkcję w pakiecie R. Ale po rozległym Googlingu nigdzie nie mogę jej znaleźć. Funkcja, o której myślę, wygenerowała podsumowanie graficzne dla danej zmiennej, generując dane wyjściowe z niektórymi wykresami (histogram i być może wykres z pudełkiem i wąsami) oraz tekstem zawierającym takie szczegóły, jak …

5
„Eksploracja” danych a „szpiegowanie” danych / „torturowanie”?
Wiele razy spotkałem się z nieformalnymi ostrzeżeniami przed „szpiegowaniem danych” (oto jeden zabawny przykład ) i myślę, że mam intuicyjne wyobrażenie z grubsza, co to oznacza i dlaczego może to stanowić problem. Z drugiej strony „eksploracyjna analiza danych” wydaje się być całkowicie godną szacunku procedurą w statystyce, przynajmniej sądząc po …

4
Czy czasopismo Science poparło analizę Garden of Forking Pathes Analyzes?
Idea adaptacyjnej analizy danych polega na tym, że zmieniasz swój plan analizowania danych, gdy dowiadujesz się więcej na ten temat. W przypadku eksploracyjnej analizy danych (EDA) jest to ogólnie dobry pomysł (często szukasz nieprzewidzianych wzorców w danych), ale w przypadku badania potwierdzającego jest to powszechnie akceptowane jako bardzo błędna metoda …

2
Jak poradzić sobie z analizą danych eksploracyjnych i pogłębianiem danych w badaniach na małych próbach?
Analiza danych eksploracyjnych (EDA) często prowadzi do eksploracji innych „ścieżek”, które niekoniecznie należą do początkowego zestawu hipotez. Taką sytuację mam w przypadku badań z ograniczoną wielkością próby i dużą ilością danych zebranych za pomocą różnych kwestionariuszy (dane społeczno-demograficzne, skale neuropsychologiczne lub medyczne - np. Funkcjonowanie psychiczne lub fizyczne, poziom depresji …


6
Błąd strzelców wyborowych w Teksasie w analizie danych eksploracyjnych
Czytałem ten artykuł w Nature, w którym wyjaśniono niektóre błędy w kontekście analizy danych. Zauważyłem, że błąd teleobiektywu w Teksasie był szczególnie trudny do uniknięcia: Pułapkę poznawczą, która czeka podczas analizy danych, ilustruje bajka strzelca wyborowego w Teksasie: nieudolny strzelec wyborowy, który wystrzeliwuje losowy wzór pocisków z boku stodoły, rysuje …
23 eda  fallacy 

5
Czego się nauczyć po Caselli i Berger?
Jestem studentem matematyki z niewielkim doświadczeniem w matematyce stosowanej. Od ostatniej jesieni chodzę na zajęcia z książki Caselli i Bergera i ukończyłem setki (230+) stron z problemami z ćwiczeniami w książce. W tej chwili jestem w rozdziale 10. Ponieważ jednak nie studiowałem statystyki ani nie planowałem być statystykiem, nie sądzę, …


1
Co to jest „efekt podkowy” i / lub „efekt łuku” w analizie PCA / korespondencji?
W statystyce ekologicznej istnieje wiele technik analizy danych eksploracyjnych danych wielowymiarowych. Są to tak zwane techniki „święceń”. Wiele z nich jest takich samych lub ściśle powiązanych z powszechnymi technikami w innych miejscach statystyki. Być może prototypowym przykładem byłaby analiza głównych składników (PCA). Ekolodzy mogą użyć PCA i powiązanych technik, aby …

8
Pomysły na oprogramowanie „laboratoryjne”?
Jest to więc dziwne dopasowanie, choć naprawdę myślę, że jest dziwne dla każdej strony, więc pomyślałem, że wypróbuję to tutaj, wśród moich braci, którzy mają problemy z danymi. Przyszłam do epidemiologii i biostatystyki z biologii i nadal zdecydowanie mam pewne nawyki z tej dziedziny. Jednym z nich jest prowadzenie zeszytu …

2
Jak przeprowadzić eksploracyjną analizę danych, aby wybrać odpowiedni algorytm uczenia maszynowego
Studiujemy uczenie maszynowe za pośrednictwem uczenia maszynowego: perspektywa probabilistyczna (Kevin Murphy). Chociaż tekst wyjaśnia teoretyczne podstawy każdego algorytmu, rzadko mówi, w którym przypadku algorytm jest lepszy, a kiedy to robi, nie mówi, jak powiedzieć, w którym przypadku jestem. Na przykład przy wyborze jądra powiedziano mi, aby przeprowadzić eksploracyjną analizę danych, …

5
Dobry sposób na wyświetlanie wielu danych w formie graficznej
Pracuję nad projektem, który obejmuje 14 zmiennych i 345 000 obserwacji danych mieszkaniowych (takich jak rok budowy, powierzchnia, sprzedana cena, okręg zamieszkania itp.). Niepokoję się próbą znalezienia dobrych technik graficznych i bibliotek R, które zawierają niezłe techniki kreślenia. Już widzę, co w ggplot i sieci będą ładnie działały, i myślę …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.