보고 할 유효 자릿수


12

대학의 첫 학년과 같이 상당히 표준적인 상황에서 평균 또는 신뢰 구간에 대해보고 할 유효 자릿수를 결정하는 더 과학적인 방법이 있습니까?

테이블에 넣을 유효 숫자 수를 보았습니다 . 왜 유효 자릿수유효 숫자를 카이 제곱 적합 에 사용하지 않습니까?

수업 시간에 학생들에게 결과에서 표준 오류가 발생했을 때 15 자리의 유효 숫자를보고하는 것은 잉크 낭비라고 설명하려고 노력합니다. 내 직감은 . 이는 E29를 참조 하는 ASTM-Reporting Test Results 와 와 사이 여야한다고 말하는 것과 크게 다르지 않습니다 .0.25σ0.5 σ0.05σ0.5σ

편집하다:

x아래와 같은 숫자가 있으면 평균 및 표준 편차를 인쇄하는 데 몇 자리를 사용해야합니까?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

질문 : 평균 및 표준 편차에 대한 정밀도 (이중 정밀도 벡터로 구성된 경우)가 무엇인지 자세히 설명하고 평균 및 표준 편차를 유효 자릿수로 인쇄하는 간단한 R 교육학 함수를 작성하십시오. 벡터에 반영됩니다 x.


"표에 넣을 유효 숫자 수"가 귀하의 질문을 완전히 해결하지 못하는 이유를 이해하지 못합니다.
whuber

@whuber 해당 질문에 대한 귀하의 답변을 원하지만 조금 더 자세한 내용을 원합니다.
Sean

1
그러나 무엇에 대한 세부 사항? 어쨌든, 귀하의 질문 이 실제로 그 질문 과 정확히 일치하는 것처럼 들리고 귀하 가 원하는 것은 답변의 개선을 보는 것입니다. 제가 맞습니까? BTW, 교육적 지침을 찾고 있다면 지리 좌표보고와 관련하여 gis.stackexchange.com/questions/8650 에 게시 한 하나의 전문화 된 예를 알려 드리고자 합니다. 대부분의 독자가 쉽고 직관적으로 파악할 수있는 크기의 객체가있는 숫자. 다른 응용 프로그램에서도 비슷한 접근 방식이 효과적 일 수 있습니다.
whuber

1
@ whuber 네, 맞습니다. 저는 그 예를 좋아합니다. 정밀도가 표준 편차와 어떻게 관련되는지에 대해 더 자세히 찾고 있다고 가정합니다. 예를 들어, R에서, x <-rnorm (30); 평균 (x); sd (x) # 여기에서 sd는 약 1이지만 분명히 R에서는 평균이 7 자리의 정밀도로 인쇄됩니다. sd (x) / 30은 약 0.18이다. 감사합니다
Sean

에서 R인쇄가 글로벌 값에 의해 제어됩니다 (물론 거의 모든 소프트웨어) (참조 options(digits=...)하지 정밀의 고려에 의해).
whuber

답변:


9

측정 불확실성 안내서 (GUM)는 불확실성을 2 자리 이하로보고하고 결과를 불확실성과 일치시키는 데 필요한 유효 자릿수로보고 할 것을 권장합니다. 아래의 7.2.2 절을 참조하십시오

http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf

다음 코드는 R 에서이 권장 사항을 구현하려는 시도였습니다 .Noe R이 중요하더라도 출력에서 ​​후행 0을 유지하려는 시도와 협력 할 수는 없습니다.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

완전성 : > gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
마름모

@rhombidodecahedron 불확실성은하지 말았어야 하나 여기에 큰 그림을? 82 ± 3 (× 10²)
jfs

@ jfs 권고는 불확실성에서 두 가지 중요한 수치를 사용한다고 말합니다. 그렇지 않습니까?
rhombidodecahedron은

@ rhombidodecahedron 대답은 "2를 넘지 않는다" 고 말합니다 . GUM의 기준은 분명하지 않습니다. arxiv.org/pdf/1301.1034.pdf 의 표 3은 7 자리 미만의 측정에 대해 유효 숫자 1 자리를 제안합니다.
jfs

예제 코드는 제안 된 GUM 규칙을 따르지 않습니다. 경우 val = 8165.666unc = 338.9741, 측정은 다음과 같이보고해야한다 val = 8.17(34)*10^3(하지 val = 8170unc = 340주어진), 불확실성의 두 자리 숫자는 의미가 있음을 분명히합니다.
divenex

6

신뢰 구간과 통계 값을 표시하면 원하는만큼 많은 유효 숫자를 제공하는 데 아무런 문제가 없습니다.이 경우 많은 유효 숫자는 신뢰 구간이 제공하는 것만 큼 허위 정밀도를 암시하지 않기 때문입니다 가능한 실제 정밀도 의 표시 (신뢰할 수있는 간격이 더 낫습니다). 그것은 본질적으로 테이블을 깔끔하고 간결하며 읽을 수있게 만드는 문제이므로 본질적으로 모든 경우에 적합한 간단한 규칙은 없을 것입니다.

과학적 연구에서는 복제 가능성이 중요하므로 이상적으로는 여러 가지 siginifcant 수치로 결과를 재현 할 수 있어야합니다 (실제적으로 중요한지 여부). 소수의 유효 숫자로 반올림하면 결과의 반올림으로 인해 오류가 가려 질 수 있으므로 연구 복제에 대한 신뢰도가 떨어질 수 있으므로 일부 상황에서는 반올림에 대한 단점이있을 수 있습니다.

너무 멀리 반올림하지 않는 또 다른 이유는 다른 사람들이 연구를 실제로 반복하지 않고 확장 할 수 없기 때문입니다. 예를 들어 Friedman 테스트를 사용하여 다양한 머신 러닝 알고리즘을 비교하는 논문을 게시 할 수 있습니다. 이는 Friedman 테스트를 통해 벤치 마크 데이터 세트에 대한 다양한 알고리즘의 순위에 따라 다릅니다. 각 데이터 세트의 개별 분류 자에 대한 통계가 표준 오류에 따라 여러 가지 중요한 수치로 제공되는 경우 순위에서 많은 명백한 유대가 형성 될 것입니다. 이는 (i) 논문의 독자 / 검토자가 논문에 제공된 결과에서 Friedman 테스트를 복제 할 수 없으며 (ii) 다른 사람이 벤치 마크 데이터 세트에서 알고리즘을 평가하고 Friedman을 사용할 수 없음을 의미합니다. 내 연구 결과의 맥락에 맞게 테스트하십시오.


4

객관적이든 주관적 으로든 어떤 결정이든 측정 대상과 측정 도구의 정확성에 크게 좌우됩니다. 후자는 관측 된 변이의 일부일 뿐이며 기존의 증거를 식별하거나 찾기가 쉽지 않습니다. 따라서 나는 객관적이고 보편적으로 적용 가능한 결정이 없다는 것을 강력하게 의심합니다. 당신은 단지 당신의 두뇌를 사용하고 각 상황에서 최선의 판단을해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.