우도 원칙이 잦은 확률과 충돌하면 그 중 하나를 버립니까?


19

최근에 여기 에 게시 된 의견 에서 한 의견 자는 Larry Wasserman 이 블로그를 가리키며이 기사는 빈번한 추론이 우연의 원칙과 충돌한다고 지적합니다.

우도 원칙은 단순히 유사한 우도 함수를 생성하는 실험에서도 유사한 추론이 이루어져야한다고 말합니다.

이 질문의 두 부분 :

  1. 빈번한 추론의 어떤 부분, 풍미 또는 학교가 구체적으로 가능성 원칙을 위반합니까?

  2. 충돌이 있으면 둘 중 하나를 버려야합니까? 그렇다면 어느 것입니까? 해킹로열 은 가능성 원칙이 공리적이라는 것을 저에게 확신 시켰기 때문에 우리가 무언가를 버려야 할 경우 충돌하는 잦은 추론의 부분을 버려야한다고 제안합니다 .


2
가능성 원칙이 왜 공리 여야하는지 이해하지 못했습니다.
Stéphane Laurent

6
안녕, 스테판 문제는 Birnbaum이 그 가능성이 반드시 지켜야 할 자연적인 다른 두 원칙과 동등하다는 것을 증명했다는 것입니다. 이 결과에 대한 간단한 리뷰를 작성했습니다. 여기 : ime.usp.br/~pmarques/papers/redux.pdf
Zen

@ 젠 감사합니다. 언뜻보기에 내가 동의하지 않는 점은 조건부 원칙 아래에 쓰여진이 문장입니다. "무엇이 실제로 일어난 일입니까?" 대신 "무엇이 일어날 수있는 문제들 중에서 실제로 일어난 일이 중요합니다"(내 영어가 정확하지 않은 경우 미안합니다)라고 말해야합니다. 그것이 gui11aume과의 토론에서 내가 주장한 것입니다 : 어떤 의미에서, 가능성의 원리는 실험의 설계가 중요하지 않다고 주장하며,이 점에 동의 할 수 없습니다.
Stéphane Laurent

1
@ 젠 이제 나는 당신의 논문을 더 자세히 읽었습니다. 조건부 원칙과 불일치 원칙에 동의하지 않는 것이 사실입니다.
Stéphane Laurent

1
LP는 오늘날 실용적인 이유 때문에 그렇게 인기가 없습니다. 종교적으로 채택함으로써 Jeffreys의 이전, 켤레 이전 및 이전과 같은 모델 의존적 사전의 사용은 많은 상황에서 유용 할 수 있습니다. 나는 통계, 생각 물리학 같은 (이 토론처럼 들릴 수도 있지만, 의미있는 방식으로 axiomatised 할 수없는 ). 그러나 다른 패러다임의 장단점을 식별하는 것이 중요합니다.

답변:


12

가능성 원칙과 충돌하는 빈번한 접근 방식의 일부는 통계 테스트 이론 (및 p- 값 계산)입니다. 일반적으로 다음 예제에서 강조 표시됩니다.

두 명의 Frequentist가 편향된 동전을 연구하려고하는데,이 동전은 알 수없는 가능성 '머리'가 됩니다. 그들은 그것이 '꼬리'쪽으로 편향되어 있다고 의심하므로 동일한 귀무 가설 및 동일한 대립 가설 가정 합니다.P = 1 / 2 P < 1 / 2pp=1/2p<1/2

첫 번째 통계학자는 'heads'가 나타날 때까지 동전을 뒤집습니다. 두 번째는 동전을 6 번 뒤집기로 결정하고 마지막 던지기에서 하나의 '머리'만 얻습니다.

첫 번째 통계학 자의 모형에 따르면 p- 값은 다음과 같이 계산됩니다.

(1)5+(1)6+...=(1)511=(1)4.

두 번째 통계학 자의 모형에 따르면 p- 값은 다음과 같이 계산됩니다.

(61)(1)5+(60)(1)6=(5+1)(1)5.

장착 함으로써 , 제 찾는 p- 값은 동일 은 P 값이 동일한 상기 제 발견 .1 / 2 1 / 2 5 = 0.03125 7 / 2 × 1 / 2 5 = 0.1093751/21/25=0.031257/2×1/25=0.109375

그래서 그들은 다른 일을했기 때문에 다른 결과를 얻습니다. 그러나 우도 원칙 에 따르면 , 그들은 같은 결론에 도달해야한다. 간단히 말하면, 가능성 원칙은 가능성이 모든 것이 추론에 중요하다고 명시합니다. 따라서 여기에서의 충돌은 두 관측치 모두 비례하는 동일한 가능성을 갖기 때문에 발생합니다 (가능성은 비례 상수까지 결정됨).(1)5

내가 아는 한, 두 번째 질문에 대한 답은 논란의 여지가 있습니다. 나는 개인적으로 위의 이유로 테스트를 수행하고 p- 값을 계산하지 않고이 블로그 게시물에 설명 된 다른 사람들을 피하려고합니다 .

편집 : 이제 그것에 대해 생각하면, 신뢰 구간에 의한 추정 도 다를 것입니다. 실제로 모델이 다른 경우 CI는 구성에 따라 다릅니다.


1
실제 결과를 기반으로 한 가능성뿐만 아니라 각 가능한 결과의 확률을 고려하기 때문에 잦은 통계 (가설 검정, 신뢰 구간)에서 가능성 원칙이 분명히 위반된다는 인상을 받고 있습니다. 권리 ?
Stéphane Laurent

@ Stéphane Laurent 네, 그렇게 이해합니다. James Berger는 통계 결정 이론 및 베이지안 분석 에서 좋은 인용을 얻었습니다. 이는 Frequentist가 때때로 관찰되지 않은 데이터로 인해 가설을 기각한다고 말합니다.
gui11aume

고마워, gui11aume. P- 값의 '의미'가 실험자의 의도에 따라 다른 예를 해석 할 권리가 있습니까? P- 값이 귀무 가설 하에서 균일하게 분포되어야하기 때문에 일종의 임계 값 오 탐지율로 해석되는 경우라고 가정합니다. 이는 P- 값이 증거의 강도를 나타내는 지표로 제시되는 Fisher의 접근 방식에 필요합니까?
Michael Lew

4
(+1) 이러한 종류의 불일치는 일반적으로 모델 중 하나에 중지 규칙 이 포함 된 경우에 나타납니다 .

1
@Scortchi 사실 나는 P- 값 중 하나가 올바른 가능성 함수를 가리키고 다른 하나는 그렇지 않다고 생각하는 것으로 잘못 생각되었습니다. 둘 다 헤드 확률과 관련된 증거를 제시하는 동일한 가능성 함수를 가리 킵니다. 내 이전 의견의 마지막 두 문장을 무시해야합니다. (편집 할 수 없나요?)
Michael Lew

4

@ gui11aume (+1)의 예제를 좋아하지만 두 의 차이는 두 실험자가 사용하는 다른 중지 규칙으로 인해 발생 한다는 인상을 줄 수 있습니다 .

사실, 나는 이것이 훨씬 일반적인 현상이라고 생각합니다. @ gui11aume의 대답에서 두 번째 실험자를 생각해보십시오. 동전을 6 번 던지고 마지막 던지기에서만 머리를 관찰하는 사람. 결과는 다음과 같습니다. 이란 무엇입니까 -value는? 일반적인 접근 방식은 공정한 동전으로 인해 헤드가 한 개 이하일 확률을 계산하는 것입니다. 거기 총 아웃 가능성 일 이하의 헤드와, 이에 따라 .P 7 (64) , P = 7 / 64 0.109

H,
764=7/640.109

그러나 다른 테스트 통계를 보지 않겠 습니까? 예를 들어,이 실험에서 우리는 5 개의 꼬리가 연속으로 관찰되었습니다. 가장 긴 꼬리 시퀀스의 길이를 검정 통계량으로 봅시다. 연속으로 5 개 또는 6 개의 꼬리 가있는 가능성이 있으므로 입니다.P = 3 / 64 0.047=/640.047

따라서이 경우 오류율이 로 고정 된 경우 테스트 통계를 선택하면 결과가 쉽게 중요하지 않게 될 수 있으며 중지 규칙 자체 와는 아무런 관련이 없습니다 .α=0.05


투기 부

철학적으로, 테스트 통계의 빈번한 선택은 이전의 베이지안 선택과 비슷한 모호한 의미라고 말할 수 있습니다. 우리는 불공평 한 동전이 이런 식으로 또는 그와 같은 방식으로 행동 할 것이라고 믿기 때문에 하나 이상의 테스트 통계를 선택합니다 (그리고 우리는이 행동을 감지 할 힘을 원합니다). 코인 유형을 미리 지정하는 것과 비슷하지 않습니까?

그렇다면, 모든 증거가와 충돌하지 않는 가능성에 있음을 말하는 가능성 원리 때문에, -values - 값이 그 다음입니다 뿐만 은 "증거 금액". 그것은 "놀람의 척도"이지만, 우리가 놀라게 될 것을 설명한다면 무언가는 단지 놀라움의 척도가 될 수 있습니다! -value 시도는 하나의 스칼라 양의 증거와 (검정 통계량의 선택으로 대표되는) 이전에 기대 어떤 종류의 모두를 결합한다. 그렇다면 가능성 자체와 비교하지 말고 아마도 후부와 비교해야합니까?p p

이 추론 적 부분, 여기 또는 채팅에 대한 의견을 듣고 싶습니다.


@MichaelLew과 (와) 다음 토론을 업데이트합니다

위의 나의 모범이이 논쟁의 요점을 놓친 것 같습니다. 다른 검정 통계량을 선택하면 우도 기능도 변경됩니다. 따라서 위에서 계산 된 두 개의 서로 다른 값은 서로 다른 두 가지 우도 함수에 해당하므로 우도 원리와 사이의 "충돌"의 예가 될 수 없습니다 . @ gui11aume의 예의 장점은 다르 더라도 우도 함수가 정확히 동일하게 유지된다는 것 입니다.p p

나는 여전히 위의 "투기적인"부분에 이것이 무엇을 의미하는지 생각해야합니다.


재미있는 생각. 예, P- 값이 우도 함수와 같은 방식으로 증거 로 해석되지 않는 한 LP 값과 P- 값 사이에 충돌이 필요하지 않음에 동의합니다 . 우도 함수에는 통계 모델에서 주어진 관심 모수와 관련된 증거가 포함 됩니다. 검정 통계량을 변경하면 모형이 변경되므로 대체 모형의 우도 함수는 원래의 우도 함수와 다를 수 있습니다.
Michael Lew

마이클, 나는 확실히 정확히 "통계 모델"수단을 아니지만, 머리 확률과 동전 아니다 이미 모델? 검정 통계량을 변경하면 모델이 어떻게 변경됩니까?
amoeba는

그 외에도, 나는 당신의 "To P or P to P"논문 (그리고 googled "우연성 원리")을 다시 읽고 있었기 때문에이 질문을 찾았습니다. 나는 일반적으로 논문을 좋아하지만 4.4 절에서 완전히 혼란스러워했다. 중지 규칙을 고려하여 p- 값을 "조정"해서는 안됩니다. 하지만 공식 5-6에서는 조정 된 내용이 없습니다. "조정되지 않은"p- 값은 무엇입니까? 그들 중 하나가 조정되었고 다른 하나는 조정되지 않았습니까? 그렇다면, 어느 것이, 왜 반대가 아닌가?
아메바는

통계 모델은 종종 무시되거나 변하지 않는 것으로 가정됩니다. 그러나 코인의 경우 고정 된 알 수없는 확률의 머리, 임의의 관측치 선택, 시험 헤드의 통계에 대해서는 가능한 결과의 이항 분포가 포함됩니다. 나는 결과의 분포가 행 테스트 통계에서 꼬리에 대한 것이 무엇인지 알지 못하지만 그것이 다르다고 생각합니다. 동일하더라도 검정 통계량이있는 모형은 원래 모형과 같지 않으므로 모든 증거를 포함하더라도 가능성 함수는 다를 수 있습니다.
Michael Lew

나는 그 종이의 완전한 재 작업을 거의 끝냈다. 이 토론과 관련이 있지만 아직 제출할 준비가되지 않았습니다. (이 대화입니까?)
Michael Lew
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.