Różnica w środkach a średnia różnica


11

Badając dwie niezależne próbki, powiedziano nam, że patrzymy na „różnicę dwóch średnich”. Oznacza to, że bierzemy średnią z populacji 1 ( ) i odejmujemy od niej średnią z populacji 2 ( ). Nasza „różnica dwóch średnich” to ( - ).y¯1y¯2)y¯1y¯2)

Badając sparowane próbki, powiedziano nam, że patrzymy na „średnią różnicę”, . Oblicza się to, biorąc różnicę między każdą parą, a następnie biorąc średnią wszystkich tych różnic.re¯

Moje pytanie brzmi: czy otrzymamy to samo ( - ) w porównaniu do jego jeśli obliczymy je z dwóch kolumn danych, a za pierwszym razem uznamy to za dwie niezależne próbki, a za drugim razem uznamy za sparowane dane? Bawiłem się dwiema kolumnami danych i wydaje się, że wartości są takie same! Czy w takim przypadku można powiedzieć, że różne nazwy są używane tylko z przyczyn nieilościowych?y¯1y¯2)re¯


2
Pomyśl o tym w ten sposób: jak obliczysz przy niesparowanych danych? re¯
shadowtalker

3
@ssdecontrol Zwłaszcza jeśli rozmiary próbek są różne.
Alexis,

Odpowiedzi:


12

(Zakładam, że masz na myśli „próbka”, a nie „populacja” w pierwszym akapicie).

Równoważność łatwo wykazać matematycznie. Zacznij od dwóch próbek o równej wielkości: i . Następnie zdefiniuj{x1,,xn}{y1,,yn}

x¯=1nja=1nxjay¯=1nja=1nyjare¯=1nja=1nxja-yja

Następnie masz:

x¯-y¯=(1nja=1nxja)-(1nja=1nyja)=1n(ja=1nxja-ja=1nyja)=1n((x1++xn)-(y1++yn))=1n(x1++xn-y1--yn)=1n(x1-y1++xn-yn)=1n((x1-y1)++(xn-yn))=1nja=1nxja-yja=re¯.

1
Ale dwa przedziały ufności obliczone dla „różnicy średnich” i „średniej różnicy” będą różne, prawda? Można to zobaczyć, patrząc naZA=[1,2),3),4,5,...] i b=[...,5,4,3),2),1]. Sparowana „średnia różnica” będzie inna dlaZA-ZA (czyli wszystko zero) w porównaniu z ZA-b(co nie jest równe zeru); kolejność elementów nie wpływa na różnicę średnich.
włókien

Nie mogę już edytować mojego poprzedniego postu. The 3rd zdanie powinno zaczynać „Sekwencja sparowanych«oznaczają różnice»...”
BERS

@bers co robi ZA-ZAmieć z tym wspólnego?
shadowtalker,

Założyć do=ZA. NastępnieZA-do i ZA-bto dwie różne sekwencje. Przedział ufności dla średniej sparowanej różnicy z pewnością będzie różny w obu przypadkach. Ale różnica średnich, a więc i przedział ufności, będzie zarówno indentycznaZA-do i ZA-b. A może się mylę?
włókien

@bers Myślę, że jesteś zdezorientowany, ale jestem zdezorientowany co do tego, co Cię myli.
shadowtalker,

0

rozkład średniej różnicy powinien być węższy niż rozkład różnicy średnich. Zobacz to na prostym przykładzie: średnia w próbce 1: 1 10 100 1000 średnia w próbce 2: 2 11 102 1000 różnica średnich wynosi 1 1 2 0 (w przeciwieństwie do samych próbek) ma mały standard.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.