Liczba cyfr znaczących do zgłoszenia


12

Czy istnieje bardziej naukowy sposób określania liczby cyfr znaczących, które należy zgłosić dla średniej lub przedziału ufności w sytuacji, która jest dość standardowa - np. Klasa pierwszego roku na studiach.

Widziałem liczbę znaczących cyfr do umieszczenia w tabeli , dlaczego nie używamy znaczących cyfr i liczbę znaczących cyfr w dopasowaniu chi-kwadrat , ale wydaje się, że nie dotykają problemu.

Na moich zajęciach staram się wyjaśnić moim uczniom, że marnotrawstwo atramentu polega na zgłaszaniu 15 cyfr znaczących, gdy mają tak szeroki standardowy błąd w swoich wynikach - miałem przeczucie, że powinno się je zaokrąglać mniej więcej do około . Nie różni się to zbytnio od tego, co mówi ASTM - raportowanie wyników testu odnoszących się do E29, gdzie, jak twierdzą, powinno ono wynosić od 0,05 σ do 0,5 σ0.25σ0.05σ0.5σ .

EDYTOWAĆ:

Kiedy mam zestaw liczb takich jak x poniżej, ile cyfr powinienem użyć, aby wydrukować średnią i odchylenie standardowe?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

PYTANIE: Podaj szczegółowo, jaka jest precyzja (gdy istnieje wektor liczb podwójnej precyzji) dla średniej i odchylenia standardowego, i napisz prostą funkcję pedagogiczną R, która wypisze średnią i odchylenie standardowe na znaczną liczbę cyfr, które znajduje odzwierciedlenie w wektorze x.


Nie rozumiem, dlaczego „Liczba znaczących liczb, które należy umieścić w tabeli” nie odpowiada w pełni na twoje pytanie: w jakim punkcie brakuje tego pytania?
whuber

Podoba mi się twoja odpowiedź na to pytanie @ whuber, ale chciałbym trochę bardziej szczegółowo.
Sean

1
Ale szczegóły na temat czego? W każdym razie brzmi to tak, jakby twoje pytanie było naprawdę dokładną kopią tego pytania , a chciałbyś zobaczyć poprawki do jego odpowiedzi. Mam rację? BTW, jeśli szukasz wskazówek pedagogicznych, chciałbym wskazać jeden (specjalistyczny) przykład opublikowany na gis.stackexchange.com/questions/8650 dotyczący zgłaszania współrzędnych geograficznych: chodzi o powiązanie liczb znaczących cyfry z obiektami, których rozmiary większość czytelników z łatwością uchwyci. Podobne podejście może działać dobrze w innych aplikacjach.
whuber

1
@ whuber tak masz rację i podoba mi się ten przykład. Przypuszczam, że szukam bardziej szczegółowych informacji na temat związku precyzji z odchyleniem standardowym. Np. W R, x <- rnorm (30); średnia (x); sd (x) # tutaj wyraźnie sd wynosi około 1, ale w R średnia jest drukowana domyślnie z 7 cyframi dokładności. sd (x) / 30 wynosi około 0,18. Dzięki
Sean

W R(podobnie jak prawie w każdym oprogramowaniu) drukowanie jest kontrolowane przez wartość globalną (patrz options(digits=...)), a nie przez jakiekolwiek uwzględnienie precyzji.
whuber

Odpowiedzi:


9

W Przewodniku po niepewności pomiaru (GUM) zaleca się zgłaszanie niepewności nie więcej niż 2 cyframi i zgłaszanie wyniku wraz z liczbą cyfr znaczących potrzebnych do zapewnienia zgodności z niepewnością. Sekcja 7.2.2 poniżej

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

Poniższy kod był moją próbą zaimplementowania tego zalecenia w R. Noe, że R może nie współpracować z próbami zachowania końcowych zer na wyjściu, nawet jeśli są znaczące.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

Dla kompletności: > gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
rhombidodecahedron

@rhombidodecahedron nie powinien mieć tutaj tylko jednej znaczącej liczby? 82 ± 3 (× 10²)
jfs

@jfs zalecenie mówi, aby użyć dwóch znaczących liczb w niepewności, prawda?
rhombidodecahedron

@ rhombidodecahedron odpowiedź mówi „nie więcej niż 2” Kryteria w GUM są dla mnie niejasne. Tabela 3 z arxiv.org/pdf/1301.1034.pdf sugeruje 1 znaczącą cyfrę do zgłoszenia dla mniej niż 7 pomiarów.
jfs

Przykładowy kod nie jest zgodny z sugerowaną regułą GUM. Jeśli val = 8165.666i unc = 338.9741, pomiar należy podać jako val = 8.17(34)*10^3(a nie val = 8170z unc = 340podanym), aby wyjaśnić, że tylko dwie cyfry niepewności są znaczące.
divenex

6

Jeśli pokazuje się przedział ufności, a także wartość statystyki, nie ma problemu z podaniem tylu znaczących liczb, ile się chce, ponieważ w tym przypadku duża liczba znaczących liczb nie oznacza fałszywej precyzji, ponieważ przedział ufności daje wskazanie prawdopodobnego rzeczywistej precyzji (wiarygodny przedział byłoby lepiej). Zasadniczo chodzi o to, aby stół był schludny, zwięzły i czytelny, więc zasadniczo nie jest prawdopodobne, aby istniała prosta zasada, która pasowałaby na każdą okazję.

Powtarzalność jest ważna w badaniach naukowych, dlatego idealnie powinna być możliwa reprodukcja wyników na dowolną liczbę znaczących cyfr (niezależnie od tego, czy mają one znaczenie praktyczne, czy nie). Zaokrąglenie do niewielkiej liczby znaczących liczb może zmniejszyć zaufanie do replikacji badania, ponieważ błędy mogą być maskowane przez zaokrąglanie wyników, więc w niektórych okolicznościach może wystąpić wada.

Innym powodem, dla którego nie można zaokrąglić za daleko, jest to, że może uniemożliwić innym rozszerzenie badania bez jego powtórzenia. Na przykład mógłbym opublikować artykuł porównujący różne algorytmy uczenia maszynowego przy użyciu testu Friedmana, który zależy od rankingu różnych algorytmów w zestawie zestawów danych testowych. Jeśli statystyki dla poszczególnych klasyfikatorów w każdym zbiorze danych zostaną podane wielu znaczącym liczbom w zależności od ich standardowych błędów, niewątpliwie stworzy to wiele widocznych powiązań w rankingach. Oznacza to, że (i) czytelnik / recenzent pracy nie będzie w stanie powtórzyć testu Friedmana z wyników podanych w pracy oraz (ii) ktoś inny nie będzie w stanie ocenić swojego algorytmu w zestawach danych porównawczych i użyje Friedmana test, aby umieścić go w kontekście wyników z moich badań.


4

Z pewnością każda decyzja, podjęta obiektywnie lub subiektywnie, będzie silnie zależeć od tego, co mierzysz i od tego, jak precyzyjny jest twój przyrząd pomiarowy. Ta ostatnia jest tylko częścią obserwowanej odmiany i nie zawsze jest łatwa do rozpoznania lub znalezienia istniejących dowodów. Dlatego mocno podejrzewam, że nie ma obiektywnej, powszechnie stosowanej decyzji. Musisz tylko użyć swojego mózgu i dokonać najlepszego osądu w każdej sytuacji.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.