p- 값이 점 추정치입니까?


32

p- 값에 대한 신뢰 구간을 계산할 수 있고 구간 추정과 반대되는 점은 점 추정치이므로 p- 값은 점 추정값입니까?


6
p- 값에 대한 신뢰 구간을 계산할 있다고 생각하지 않습니다 . 데이터 생성 프로세스를 설명하는 매개 변수가 아니라 데이터에서 계산 된 통계입니다. 물론 통계 추정치에 대해서는 여전히 질문 할 수 있습니다.
Scortchi-Monica Monica 복원

1
@Scortchi : 다음 P-값의 분포를 계산하기 위해 예를 들어 부트 스트랩을 적용 할 수 있었다하지만 만약 그것이 p- 값의 신뢰 구간이 아니다 경우는, 다음 간격이 부트 스트랩 배포 % 백분위 95 구성했다 - 무엇 인 그것은 ?
아메바는

2
@amoeba : 신뢰 구간은 알려지지 않은 모수에 관한 것이고 부트 스트랩 간격은 통계에 대한 95 % 영역의 근사치입니다.
시안

@ Scorthci : p- 값에 대한 CI를 인쇄하는 소프트웨어를 보았습니다. 이 경우 근사 p- 값은 순열 테스트에 의해 계산되었으므로 CI가 너무 넓 으면 (예 : p- 값 및 p- 값 [ 0.05 , 1 ] ) 더 많은 순열을 사용하게됩니다 추론하기 전에. [0,0.05][0.05,1]
Cliff AB

4
@Cliff 분포 의 p- 값 속성에 대한 신뢰 구간이 아닙니다 . 이는 특정 표본에 대한 검정의 p- 값에 대한 확률 적 추정기의 신뢰 구간입니다. 그것들은 비슷하게 들리고 둘 다 간격이지만 완전히 다른 것입니다.
whuber

답변:


23

점 추정치 및 신뢰 구간은 분포를 설명하는 모수 (예 : 평균 또는 표준 편차)에 대한 것입니다.

그러나 표본 평균 및 표본 표준 편차와 같은 다른 표본 통계와 달리 p- 값은 흥미로운 분포 모수의 유용한 추정기가 아닙니다. 기술적 세부 사항은 @whuber의 답변을 참조하십시오.

검정 통계량에 대한 p- 값은 귀무 가설이 참이라는 가정하에 계산 된대로 표본에서 관측 된 것보다 큰 검정 통계량의 기대 값과의 편차를 관찰 할 확률을 제공합니다. 전체 분포가있는 경우 귀무 가설과 일치하거나 그렇지 않습니다. 이것은 인디케이터 변수로 설명 할 수 있습니다 (다시 말해서 @whuber의 답변 참조).

그러나 귀무 가설이 참이면 p- 값이 표본 크기가 증가함에 따라 p- 값이 수렴하지 않기 때문에 p- 값은 지표 변수의 유용한 추정값으로 사용할 수 없습니다. 이것은 통계 테스트가 널을 거부하거나 거부 할 수 있지만 절대로 확인하지 않는다는 것을 나타내는 매우 복잡한 대체 방법입니다.


3
통계 테스트 (Lehman, Kiefer 등)에 대한 대부분의 설명은 "인구"를 전혀 언급하지 않고 대신 분포 모수 추정 측면에서 상황을 구성합니다 . 이것은 무작위성이 샘플링에만 기인 할 필요는 없으며, 따라서 이론이 확률이 모형의 일부인 상황에보다 광범위하게 적용될 수 있습니다 .
whuber

2
그러나 당신은 성명서에서 "모집단과 관련된 확률이 전혀 없다"고 분명히 모순되었다. 또한 모든 추정량은 "샘플 수준에서 명시 적으로 정의됩니다" 라는 점에 유의하십시오 . 따라서이 게시물에서 어떤 구별을하려고하는지 결정하기가 어렵습니다.
whuber

2
당연하지! 그러나 분포는 인구가 아닙니다.
whuber

4
(-1) 나는 @Tim의 상식적인 대답과 whuber의 회상 한 대답에 동의하지만, 이것에 대해 이해하기가 힘들다. (1) "그러나 p- 값은 표본 수준에서 명시 적으로 정의 되었기 때문에 모집단 모수가 아닙니다": 이것은 지적 할 가치가 있지만 "그러나"는 p- 값이 표본 통계이기 때문에 표본 평균이 표본 추정치가 될 수없는 것처럼 표본 통계량이므로 추정치가 아닙니다. ...
Scortchi-복원 Monica Monica

2
(2) "이것은 모집단과 관련된 확률이 전혀 없기 때문에 고정되어 있지만 알려지지 않은 것으로 간주됩니다."(a) "확률이 없기 때문에 표본에서 p- 값이 계산되지 않습니다 . .] "; (b) @whuber가 지적한 것처럼 유한 모집단에서의 샘플링은 특별한 경우입니다. (c) 어쨌든 p- 값이 모집단에 대해 아무것도 추정하지 않는다고 말한 것을 따르지 않습니다.
Scortchi-Monica Monica 복원

21

예, p- 값이 포인트 추정치라고 주장 할 수 있습니다.

p- 값이 추정 할 수있는 분포의 속성을 식별하기 위해, 그것이 무증상 인 것으로 가정해야합니다. 그러나, 점근 귀무 가설에 대한 평균 p- 값은 (적, 일부 시험 그것은 다른 제로 참조 될 수 있음) 및 다른 가설 대이다 0 . 따라서 p- 값은 귀무 가설에 대한 지표 함수의 절반의 추정값으로 간주 될 수 있습니다.1/20


분명히 이런 식으로 p- 값을 보는 것은 약간의 창의성이 필요합니다. 우리 는 p- 값에 의한 결정 으로 문제의 추정값을 보면 조금 더 나아질 수 있습니다 . 기본 분포는 귀무 가설 또는 대립 가설의 멤버입니까? 이 가능한 결정들을 라고 부르 자 . 잭 키퍼D

통계학자가 관찰 할 수있는 실험이 있다고 가정합니다. 이 결과는 랜덤 변수 또는 랜덤 벡터 ... 로 설명됩니다 . 의 확률 법 X는 통계학을 알 수 있지만 분포 함수 것으로 알려져있다 FX는 특정 클래스의 구성원 인 Ω 분포 함수의. ...XXFXΩ

통계적 문제의 문제라고 점 추정 경우 어떤 실제 또는 벡터 값의 수 속성 값들의 집합이다 F 에 따라 F 상당히 평활 방법은.DFF

이 경우, 는 불연속 적이므로 "합리적으로 매끄럽다"는 제한이 아닙니다. 키퍼의 용어는 이산 결정 공간이있는 통계 절차를 "포인트 추정기"대신 "테스트"로 언급함으로써이를 반영합니다.D

이러한 정의의 한계 (및 한계)를 살펴 보는 것이 흥미롭지 만이 질문이 우리에게 요청한 것처럼 p- 값이 포인트 추정기라고 너무 강력하게 주장해서는 안됩니다. 유용하고 전통적인.


이 질문에 대한 언급에서 Christian Robert는 1992 년 논문에 주목했으며, 공동 저자는이 관점을 정확하게 취하여 지표 함수의 추정치로서 p- 값의 허용 가능성을 분석했습니다 . 아래 참고 문헌의 링크를 참조하십시오. 신문이 시작됩니다

가설 검정에 대한 접근법은 일반적으로 검정 문제를 추정이 아니라 의사 결정의 하나로 취급했습니다. 보다 정확하게는 공식 가설 검정을 통해 가설이 참인지 여부에 대한 결론을 내릴 수 있으며 해당 결론과 관련된 증거를 제공 할 수 없습니다. 이 논문에서 우리는 의사 결정 이론 프레임 워크 내에서 가정 테스트를 추정 문제로 고려한다 .

[공포도 추가]


참고 문헌

황건 운, 조지 카스텔라, 크리스티안 로버트, 마틴 티 웰스, 로저 H. 파렐, 테스트 정확도 추정 . 앤 통계 학자. 20 권 1 호 (1992), 490-509. 오픈 액세스 .

Jack Carl Kiefer, 통계적 추론 소개 . Springer-Verlag, 1987.


2
흠. 이 견해가 도움이되는지 잘 모르겠습니다. 이러한 의미에서 p- 값은 귀무 가설이 참이면 일관되지 않기 때문에 좋은 추정값이 아닙니다. 그리고 어떤 경우에는 (샘플 크기에 의존하는) 바이어스도 있습니다. 기술적으로 사실 일 수 있지만 임의의 숫자는 모든 매개 변수에 대한 (끔찍한) 추정치 일 수 있습니다.
에릭

10
이 질문은 p- 값이 좋은 추정량 인지 여부를 묻지 않습니다 , @Erik. 추정자로서 명백한 결함이 있습니다. 예를 들어 귀무 가설에 대한 점근 분산은 0이 아닙니다. 거의 모든 비 편향 추정량 의 치우침은 표본 크기에 따라 다릅니다. 독립 난수가 추정기로 간주 될 수는 있지만, 다른 것으로 추정 할 수 있습니다. 정의에 따라 자체 평균을 추정합니다. 따라서 귀하의 반대 의견은 당면한 질문과 관련이없는 것으로 보입니다.
whuber

7
나는 "도움이되지 않는"부분을 제외하고 @Erik과 같은 점에서 우리가 다르다고 생각하지 않습니다. Nick Cox가이 글의 다른 부분에서 언급 한 것처럼 p- 값이 추정기로 간주 될 수 있다는 의미와 정확하게 추정 할 수있는 의미를 고려하는 것이 흥미 롭습니다 . 그것은 p- 값이 무엇인지 아닌지 조금 더 잘 이해하는 데 도움이 될 수 있습니다. 많은 사람들이 그것을 유용한 운동 으로 여길 것 입니다.
whuber

7
A의 1992 종이 , 우리는 연구 지표 함수의 추정으로 - 값 I Θ 0 ( θ를 ) 하고 일방적 인 가설에 대한 허용 추정 할 수 있으며, 양면 가설에 대한 허용 될 수 없음을 보여줍니다. pIΘ0(θ)
시안

1
@ Xi'an 나는 우리가 당신 뒤에 23 년 뒤에있는 것을 본다 .... 참조 주셔서 감사합니다!
whuber

11

-values이p되지 않습니다사용하는관심의 매개 변수를 추정하지만, 가설 테스트. 예를 들어, 인구 추정에 관심이있을 수 당신이 가지고있는 샘플을 기반으로, 또는 당신은 그것의 간격 추정에 관심이있을 수 있지만, 가설 테스트 시나리오에서 당신은 오히려 평균 샘플을 비교하는 것 ¯ X 인구 평균 μ 여부를 확인하려면 그들은 다릅니다. 실제로 가설 검정 시나리오에서는특정 값에 관심이없지만일부 임계 값 미만인 경우 (예 : p < 0.05 ) 와 Pμx¯μp<0.05p-값 당신은 그들의 포인트 값에 그다지 관심이 없지만, 데이터가 귀무 가설에 대해 충분한 증거를 제공하는지 알고 싶어합니다. 가설 검정 시나리오에서는 서로 다른 을 서로 비교하지 않고 각 값을 사용하여 가설에 대한 개별 결정을 내립니다. 선체 가설에 대해 아무 것도 알고 싶지 않다. 이 점은 의사 결정 컨텍스트와 값을 분리 할 수 ​​없으므로 점 추정치와는 그 자체로 값에 관심이 있기 때문에 점 추정치와 다릅니다.p


5
초기 진술은 내용이 자주 설명되는 방식을 정확하게 반영하지만 그럼에도 불구하고 충분히 깊지는 않습니다. 여기서 기본적인 사실은 샘플마다의 변동성 인 샘플링 변동입니다. 다른 표본을 취하면 P- 값이 달라집니다. 정확히 무엇을 추정하고 있는지 알기 위해서는 약간의 독창성이 필요하며 , 매개 변수를 추정하는 것으로 설명하는 것은 (내가 아는 한) 관습 은 아니지만 그 관점은 완벽하게 이해됩니다. @ whuber의 흥미로운 답변을 참조하십시오. (전체 영역은 교육을 단순화해야 할 필요성에 따라 진흙 투성이의 문구로 가득 차 있습니다.)
Nick Cox

1
용어가 사용되는 방식은 흥미롭고 중요합니다 (그리고 개인적으로 선입견). 문제는 P- 값 무엇인지에 관한 것 입니다 . 이 스레드의 다른 곳에서도 [필연적 인 말장난]이 지적됩니다. 매개 변수를 모델 사양에 나타나는 미지수로 간주하는 것이 유용한 규칙이지만 다른 미지수도 있습니다.
Nick Cox

3
<0.05<0.01<0.001=0.003<0.05α<α
amoeba는 Reinstate Monica가

5
이 질문은 다른 많은 사람들과 교차하며, 대부분 논란의 여지가 있습니다. 하나는 테스트의 목적이 모든 문제와 전혀 일치하지 않는 결정을 예 또는 아니오로 결정하는 것입니다. 또 다른 주요 사실은 사람들이 인쇄 테이블에서 게시 된 테이블을 사용하고 사람들이 컴퓨터를 사용하지 않는 동안 정확한 P- 값에 도달하지 못했기 때문에 임계 값 수준이 수십 년 동안 사용되었다는 것입니다.
Nick Cox

4
@ 00schneider : p- 값에 대해 주어진 구간이 보이면 whuber에서 정의한 모집단 모수에 대한 신뢰 구간이 될 가능성은 거의 없습니다. 팀의 요점은 그것들을 전혀 추정 하는 것으로 간주 할 필요가 없다는 것 입니다.
Scortchi-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.