Statystyki i duże zbiory danych software

21

Czy Julia ma jakąkolwiek nadzieję na pozostanie w społeczności statystycznej?

Niedawno przeczytałem post od R-Bloggerów, który zawiera link do tego postu na blogu od Johna Mylesa White'a na temat nowego języka o nazwie Julia . Julia korzysta z kompilatora „just-in-time”, który zapewnia niesamowity szybki czas działania i ustawia go na tym samym rzędzie wielkości co C / C ++ (ta …

161 r computational-statistics software computing julia

19

Jakie są cenne projekty open source do analizy statystycznej?

Jakie są obecnie dostępne niektóre cenne projekty open source do analizy statystycznej? Edycja: jak wskazał Sharpie, wartościowe mogą oznaczać pomoc w wykonywaniu zadań szybciej lub taniej.

69 software open-source

8

Czy język R jest wiarygodny w dziedzinie ekonomii?

Jestem absolwentem ekonomii, który niedawno przeszedł na R z innych bardzo znanych pakietów statystycznych (głównie używałem SPSS). Obecnie moim małym problemem jest to, że jestem jedynym użytkownikiem R. w mojej klasie. Moi koledzy z klasy używają Staty i Gaussa, a jeden z moich profesorów powiedział nawet, że R jest idealny …

64 r software econometrics

12

Oprogramowanie potrzebne do zeskrobywania danych z wykresu [zamknięte]

Czy ktoś ma jakieś doświadczenie z oprogramowaniem (najlepiej darmowym, najlepiej open source), które zrobi zdjęcie danych wykreślonych na współrzędnych kartezjańskich (standardowy, codzienny wykres) i wyodrębni współrzędne punktów wykreślonych na wykresie? Zasadniczo jest to problem eksploracji danych i problem odwrotnej wizualizacji danych.

56 data-visualization data-mining software

9

W jaki sposób R i Python uzupełniają się w informatyce?

W wielu samouczkach lub instrukcjach narracja wydaje się sugerować, że R i Python współistnieją jako uzupełniające się elementy procesu analizy. Jednak dla mojego niedoświadczonego oka wydaje się, że oba języki robią to samo. Moje pytanie brzmi więc, czy istnieją naprawdę wyspecjalizowane nisze dla tych dwóch języków, czy może to tylko …

54 r python software

8

Excel jako stół roboczy statystyk

Wygląda na to, że wiele osób (w tym ja) lubi analizować dane eksploracyjne w programie Excel. Niektóre ograniczenia, takie jak dozwolona liczba wierszy w arkuszu kalkulacyjnym, są uciążliwe, ale w większości przypadków nie uniemożliwiają korzystania z programu Excel do zabawy z danymi. Artykuł McCullougha i Heisera jednak praktycznie krzyczy, że …

52 software computational-statistics excel

9

Czy ktoś zna jakieś dobre oprogramowanie open source do wizualizacji danych z bazy danych?

Ostatnio natknąłem się na Tableau i próbowałem wizualizować dane z bazy danych i pliku csv. Interfejs użytkownika umożliwia wizualizację danych czasowych i przestrzennych oraz błyskawiczne tworzenie wykresów. Takie narzędzie jest naprawdę przydatne, ponieważ umożliwia graficzną obserwację danych bez pisania kodu. Ponieważ istnieje wiele źródeł danych, z których muszę pobierać i …

50 data-visualization software interactive-visualization

13

Oprogramowanie do rysowania sieci bayesowskich (modele graficzne)

Szukam [darmowego] oprogramowania, które może produkować ładnie wyglądające modele graficzne, np Wszelkie sugestie będą mile widziane.

50 graphical-model software

4

OpenBugs vs. JAGS

Za chwilę wypróbuję środowisko w stylu BUGS do szacowania modeli bayesowskich. Czy są jakieś ważne zalety, które należy wziąć pod uwagę, wybierając pomiędzy OpenBugs lub JAGS? Czy jedna może zastąpić drugą w dającej się przewidzieć przyszłości? Będę używać wybranego Gibbsa Samplera z R. Nie mam jeszcze konkretnej aplikacji, ale raczej …

41 r software bugs jags gibbs

4

Czy podczas pisania z R powinienem nauczyć się ggplot2 lub ggvis?

Czy podczas pisania z R powinienem nauczyć się ggplot2 lub ggvis? Niekoniecznie chcę się uczyć obu, jeśli jeden z nich jest pod każdym względem lepszy. Dlaczego społeczność R wciąż tworzy nowe pakiety z nakładającymi się funkcjami? W blogu wprowadzającym nie wspomniano ani słowa o tym, dlaczego ggvis jest tworzony, skoro …

38 r data-visualization software

7

Dlaczego i kiedy utworzyć pakiet R?

Rozumiem, że to pytanie jest dość szerokie, ale zastanawiam się, jakie powinny być decydujące punkty przy podejmowaniu decyzji o utworzeniu (lub nie) nowego pakietu dla R. Aby być bardziej szczegółowym, dodam, że pytanie nie dotyczy powodów użyj R w sobie, więcej o decyzji o kompilacji różnych skryptów i zintegrowaniu ich …

28 r software

1

Obliczanie powtarzalności efektów z modelu Lmer

Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

9

Oprogramowanie do analizy statystyk i eksploracji danych do obsługi dużych zestawów danych

Obecnie muszę przeanalizować około 20 milionów rekordów i zbudować modele predykcyjne. Do tej pory wypróbowałem Statistica, SPSS, RapidMiner i R. Wśród nich Statistica wydaje się najbardziej odpowiedni do eksploracji danych, a interfejs użytkownika RapidMiner jest również bardzo przydatny, ale wydaje się, że Statistica, RapidMiner i SPSS są odpowiednie tylko dla …

27 large-data software data-mining

9

Jakie jest dobre narzędzie do tworzenia diagramów Sankeya?

Jak mogę utworzyć diagramy Sankeya ?

25 data-visualization software sankey-diagram

4

Biblioteki C ++ do obliczeń statystycznych

Mam określony algorytm MCMC, który chciałbym przenieść do C / C ++. Wiele kosztownych obliczeń jest już napisanych w C przez Cython, ale chcę mieć cały sampler napisany w skompilowanym języku, aby móc po prostu pisać opakowania dla Python / R / Matlab / cokolwiek. Po przeszukiwaniu skłaniam się ku …

23 mcmc software c++ computing

Pytania otagowane jako software