De novo symulacja danych z eksperymentalnej ramki danych projektowych.
Z naciskiem na R (choć inne rozwiązanie językowe byłoby świetne).
Podczas projektowania eksperymentu lub ankiety symulowanie danych i przeprowadzanie analizy tych symulowanych danych może zapewnić świetny wgląd w zalety i wady projektu.
Takie podejście może być również niezbędne do zrozumienia i właściwego wykorzystania testów statystycznych.
Proces ten bywa jednak nieco żmudny i wiele osób musi pominąć ten ważny krok w eksperymencie lub ankiecie.
Modele statystyczne i test zawierają większość informacji wymaganych do symulacji danych (w tym założenie lub wyraźne stwierdzenie rozkładu).
Biorąc pod uwagę model analizy (i związane z nim założenia, np. Normalność i równowaga), poziomy czynnika i miarę istotności (takie jak wartość p), chciałbym uzyskać dane symulowane (najlepiej z uogólnioną funkcją zbliżoną do print (), przewiduj (), symuluj ()).
Czy takie ogólne ramy symulacji są możliwe?
Jeśli tak, czy takie ramy są obecnie dostępne?
Przykład, chciałbym funkcji, takiej jak:
sim(aov(response~factor1+factor2*factor3),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
tj. uogólniona wersja:
sim.lm<-function(){
library(DoE.base)
design<-fac.design(nlevels=c(10,3,3),
factor.names=c("factor1", "factor2", "factor3"),
replications=3,
randomize=F)
response<-with(design, as.numeric(factor1)+
as.numeric(factor2)+
as.numeric(factor3)+
as.numeric(factor2)*as.numeric(factor3)+
rnorm(length(factor1)))
simulation<-data.frame(design, response)}
LUB
sim(glm(response~factor1+factor2*factor3, family=poisson),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
LUB
library(lme4)
sim(lmer(response~factor1+factor2 + (factor2|factor3)),
F_value=list(factor1=50,
factor2=50),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
które tworzyłoby kompletne odpowiednie data.frame
potencjalne przykłady konkretnych funkcji (proszę edytować do woli)
- arima.sim
istnieje funkcja tworzenia ramki danych poziomów czynników, bez modelowanej odpowiedzi:
np. conf.design
http://cran.r-project.org/web/views/ExperimentalDesign.html