최근에 여기 에 게시 된 의견 에서 한 의견 자는 Larry Wasserman 이 블로그를 가리키며이 기사는 빈번한 추론이 우연의 원칙과 충돌한다고 지적합니다.
우도 원칙은 단순히 유사한 우도 함수를 생성하는 실험에서도 유사한 추론이 이루어져야한다고 말합니다.
이 질문의 두 부분 :
최근에 여기 에 게시 된 의견 에서 한 의견 자는 Larry Wasserman 이 블로그를 가리키며이 기사는 빈번한 추론이 우연의 원칙과 충돌한다고 지적합니다.
우도 원칙은 단순히 유사한 우도 함수를 생성하는 실험에서도 유사한 추론이 이루어져야한다고 말합니다.
이 질문의 두 부분 :
답변:
가능성 원칙과 충돌하는 빈번한 접근 방식의 일부는 통계 테스트 이론 (및 p- 값 계산)입니다. 일반적으로 다음 예제에서 강조 표시됩니다.
두 명의 Frequentist가 편향된 동전을 연구하려고하는데,이 동전은 알 수없는 가능성 '머리'가 됩니다. 그들은 그것이 '꼬리'쪽으로 편향되어 있다고 의심하므로 동일한 귀무 가설 및 동일한 대립 가설 가정 합니다.P = 1 / 2 P < 1 / 2
첫 번째 통계학자는 'heads'가 나타날 때까지 동전을 뒤집습니다. 두 번째는 동전을 6 번 뒤집기로 결정하고 마지막 던지기에서 하나의 '머리'만 얻습니다.
첫 번째 통계학 자의 모형에 따르면 p- 값은 다음과 같이 계산됩니다.
두 번째 통계학 자의 모형에 따르면 p- 값은 다음과 같이 계산됩니다.
장착 함으로써 , 제 찾는 p- 값은 동일 은 P 값이 동일한 상기 제 발견 .1 / 2 1 / 2 5 = 0.03125 7 / 2 × 1 / 2 5 = 0.109375
그래서 그들은 다른 일을했기 때문에 다른 결과를 얻습니다. 그러나 우도 원칙 에 따르면 , 그들은 같은 결론에 도달해야한다. 간단히 말하면, 가능성 원칙은 가능성이 모든 것이 추론에 중요하다고 명시합니다. 따라서 여기에서의 충돌은 두 관측치 모두 비례하는 동일한 가능성을 갖기 때문에 발생합니다 (가능성은 비례 상수까지 결정됨).
내가 아는 한, 두 번째 질문에 대한 답은 논란의 여지가 있습니다. 나는 개인적으로 위의 이유로 테스트를 수행하고 p- 값을 계산하지 않고이 블로그 게시물에 설명 된 다른 사람들을 피하려고합니다 .
편집 : 이제 그것에 대해 생각하면, 신뢰 구간에 의한 추정 도 다를 것입니다. 실제로 모델이 다른 경우 CI는 구성에 따라 다릅니다.
@ gui11aume (+1)의 예제를 좋아하지만 두 의 차이는 두 실험자가 사용하는 다른 중지 규칙으로 인해 발생 한다는 인상을 줄 수 있습니다 .
사실, 나는 이것이 훨씬 일반적인 현상이라고 생각합니다. @ gui11aume의 대답에서 두 번째 실험자를 생각해보십시오. 동전을 6 번 던지고 마지막 던지기에서만 머리를 관찰하는 사람. 결과는 다음과 같습니다. 이란 무엇입니까 -value는? 일반적인 접근 방식은 공정한 동전으로 인해 헤드가 한 개 이하일 확률을 계산하는 것입니다. 거기 총 아웃 가능성 일 이하의 헤드와, 이에 따라 .P 7 (64) , P = 7 / 64 ≈ 0.109
그러나 다른 테스트 통계를 보지 않겠 습니까? 예를 들어,이 실험에서 우리는 5 개의 꼬리가 연속으로 관찰되었습니다. 가장 긴 꼬리 시퀀스의 길이를 검정 통계량으로 봅시다. 연속으로 5 개 또는 6 개의 꼬리 가있는 가능성이 있으므로 입니다.P = 3 / 64 ≈ 0.047
따라서이 경우 오류율이 로 고정 된 경우 테스트 통계를 선택하면 결과가 쉽게 중요하지 않게 될 수 있으며 중지 규칙 자체 와는 아무런 관련이 없습니다 .
철학적으로, 테스트 통계의 빈번한 선택은 이전의 베이지안 선택과 비슷한 모호한 의미라고 말할 수 있습니다. 우리는 불공평 한 동전이 이런 식으로 또는 그와 같은 방식으로 행동 할 것이라고 믿기 때문에 하나 이상의 테스트 통계를 선택합니다 (그리고 우리는이 행동을 감지 할 힘을 원합니다). 코인 유형을 미리 지정하는 것과 비슷하지 않습니까?
그렇다면, 모든 증거가와 충돌하지 않는 가능성에 있음을 말하는 가능성 원리 때문에, -values - 값이 그 다음입니다 뿐만 은 "증거 금액". 그것은 "놀람의 척도"이지만, 우리가 놀라게 될 것을 설명한다면 무언가는 단지 놀라움의 척도가 될 수 있습니다! -value 시도는 하나의 스칼라 양의 증거와 (검정 통계량의 선택으로 대표되는) 이전에 기대 어떤 종류의 모두를 결합한다. 그렇다면 가능성 자체와 비교하지 말고 아마도 후부와 비교해야합니까?p p
이 추론 적 부분, 여기 또는 채팅에 대한 의견을 듣고 싶습니다.
위의 나의 모범이이 논쟁의 요점을 놓친 것 같습니다. 다른 검정 통계량을 선택하면 우도 기능도 변경됩니다. 따라서 위에서 계산 된 두 개의 서로 다른 값은 서로 다른 두 가지 우도 함수에 해당하므로 우도 원리와 사이의 "충돌"의 예가 될 수 없습니다 . @ gui11aume의 예의 장점은 다르 더라도 우도 함수가 정확히 동일하게 유지된다는 것 입니다.p p
나는 여전히 위의 "투기적인"부분에 이것이 무엇을 의미하는지 생각해야합니다.