유효 숫자를 사용하지 않는 이유는 무엇입니까?


18

통계에서 유효 숫자를 사용하지 않는 이유는 무엇입니까? 우리의 선을 따라 무언가가 추정을 사용하므로 정밀도에 대한 규칙이 적용되지 않습니다.)?


1
독자들은 또한이 스레드를 찾을 수 있습니다 : 중요한 숫자-피겨-투-퍼-투-테이블 (table-in-put-in-table ).
gung-Monica Monica 복원

나는이 정보를 찾았습니다 : davegiles.blogspot.com/2011/12/…
John

유효 숫자에주의를 기울이는 것이 중요한 예는 stats.stackexchange.com/questions/113314나와 있습니다 . 여기서 OP는 데이터가 회귀 절차에 입력 된 정밀도의 차이로 추적 할 수있는 현저하게 다른 회귀 결과를 얻었습니다.
whuber

답변:


19

숫자 에 존재 하는 의미있는 정밀도 의 정도를 나타 내기 위해 일부 필드에서 중요한 숫자 가 사용됩니다 (화학에서 그것들에 대해 배웠습니다) . 통계에서도 중요한 주제이므로 실제로이를 지속적으로보고합니다. 다른 형식으로 만보고합니다. 구체적으로, 우리 는 추정의 정밀도 수준 (예 : 평균)을 나타내는 신뢰 구간 을보고 합니다.

와 같은 추정치의 95 % CI를 나열하면 0.50129519823975923 와 같이 평균에 대한 자릿수를 나열 할 수 있으며 문제가 없습니다. 실제로 통계 학자 Andrew Gelman은 최소한 4 개 (2009, p. 4) 를 나열 할 것을 권장했습니다 . (0.12,1.12)0.50129519823975923


(마지막 부분은 뺨에 혀로 내 불 내심으로 죄송합니다 ;-).
gung-복원 Monica Monica

2
+1. 많은 수의 자릿수가 부적절하게 응답하는 것으로 보입니다 . 다른 SE 사이트에서 비슷한 질문대한 답글 의 마지막 몇 줄을 참조하십시오 .
whuber

@gung 소수점 이하 두 자리로 CI의 끝점을 표현하려면 어떻게해야합니까?
user765195

@ user765195, 나는 그 숫자를 만들었습니다. 실제로 아무것도 언급하지 않습니다.
gung-복직 모니카

@gung 제가 묻고 싶은 것은 CI의 종점의 정밀도가 무엇입니까? 이항 비율로 Wilson CI를 계산할 때 유효한 숫자는 몇 개입니까?
user765195

12

많은 추정치, p- 값 등에보고 된 자릿수를 제한하는 한 가지 이유는 인식을 기반으로합니다. p = 0.04872429와 같은 것을보고하면 결과에서 더 정확한 것으로 인식되는 결과의 정확성이 암시됩니다 .

기본적으로 통계 결과를보고 할 때 숫자를 많이 사용하면 과도하게 권위있는 공기에서 결과를 은폐하려는 시도가 너무 많습니다.


1

나는 그것이 실제로 필요한 신뢰 수준에 달려 있다고 생각합니다. 예를 들어 CERN이 많은 결과를 위해 사용하는 99.999 % 이상과는 대조적으로 유의성있는 소수 자릿수가 95 %에 적합합니다.


더 자세한 설명을 위해 Wikipedia의 정확성 및 정밀도에 관한 기사는 원본 포스터를 잘 읽을 수 있습니다.
Robert Jones

그것은 좋은 지적이지만 특정 계산에서 𝛂 = .05 반올림하더라도 결과에 큰 영향을 줄 수 있습니다.
timothy.s.lau

1

데이터를 몇 개의 유효 숫자로 반올림하거나 최종 답변을 반올림하는 것에 대해 이야기하고 있습니까? 데이터를 반올림하면 통계 계산에 사용해야하는 노이즈가 발생하는 상황에 처할 수 있습니다.


나는 최종 답변과 중간 계산이 일반적으로 교과서에서도 반올림됨을 의미합니다.
timothy.s.lau
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.