귀무 가설이 참일 확률


14

따라서 이것은 일반적인 질문 일 수 있지만 만족스러운 답변을 찾지 못했습니다.

귀무 가설이 참 (또는 거짓) 일 확률을 어떻게 결정합니까?

학생들에게 두 가지 다른 버전의 테스트를 제공하고 해당 버전이 동일한 지 확인하고 싶다고 가정 해 봅시다. t- 검정을 수행하면 p- 값이 .02가됩니다. 좋은 p- 값! 즉, 테스트가 동등하지 않을 것입니다. 안타깝게도 P (results | null)은 P (null | results)를 알려주지 않는 것 같습니다. p- 값이 낮을 때 귀무 가설을 기각하는 것이 일반적이지만, 귀무 가설을 기각하지 않을 가능성이 매우 높다는 것을 어떻게 알 수 있습니까? 어리석은 예를 들기 위해 .02의 오 탐률로 에볼라 테스트를 설계 할 수 있습니다. 버킷에 50 개의 볼을 넣고 하나에 "에볼라"라고 적습니다. 내가 이것을 가지고 누군가를 테스트하고 그들이 "에볼라"공을 고르면, p- 값 (P (에볼라가없는 공을 따기))은 .02입니다.

내가 지금까지 고려한 것들 :

  1. P (null | results) ~ = P (results | null)라고 가정-일부 중요한 응용 프로그램에서는 분명히 거짓입니다.
  2. P (null | results)를 모르고 가설을 수락 또는 거부합니다 – 왜 우리는 그것들을 받아들이거나 거부합니까? 우리가 거짓이라고 생각하는 것을 거부하고 진실한 것을 받아들이는 것이 요점이 아닌가?
  3. 베이 즈 정리를 사용하십시오 – 그러나 당신은 어떻게 당신의 사전을 얻습니까? 실험적으로 결정하려고하는 같은 장소로 돌아 가지 않습니까? 그리고 그들을 선험적으로 고르는 것은 매우 임의적 인 것 같습니다.
  4. stats.stackexchange.com/questions/231580/에서 매우 비슷한 질문을 발견했습니다. 여기에 대한 답은 기본적으로 베이지안 질문이기 때문에 귀무 가설이 참일 가능성에 대해 묻는 것이 타당하지 않다고 말하는 것 같습니다. 어쩌면 나는 베이지안입니다 만, 그런 질문을하지 않는 것을 상상할 수 없습니다. 실제로 p- 값에 대한 가장 일반적인 오해는 실제 귀무 가설의 확률이라는 것입니다. 이 질문을 빈번한 질문으로 할 수 없다면, 나의 주요 질문은 # 3입니다 : 당신은 어떻게 루프에 갇히지 않고 당신의 우선 순위를 얻습니까?

편집 : 모든 사려 깊은 답변에 감사드립니다. 몇 가지 공통 주제를 다루고 싶습니다.

  1. 확률의 정의 : 나는 이것에 대한 많은 문헌이 있다고 확신하지만, 나의 순진한 개념은 "완벽한 합리적 존재가 정보를 주었을 것이라는 믿음"또는 "상황이 발생하면 이익을 극대화 할 수있는 내기 확률"과 같은 것입니다 "반복되었고 미지의 변화가 허용되었다".
  2. P (H0 | results)를 알 수 있습니까? 확실히 이것은 어려운 질문 인 것 같습니다. 그러나 확률은 항상 주어진 정보에 따라 달라지기 때문에 모든 확률은 이론적으로 알 수 있다고 생각합니다. 모든 이벤트가 발생하거나 발생하지 않으므로 완전한 정보가있을 가능성은 없습니다. 정보가 충분하지 않은 경우에만 존재하므로 알 수 있어야합니다. 예를 들어 누군가 누군가 동전을 가지고 있고 머리 확률을 묻는다면 50 %라고 말할 것입니다. 코인은 머리에 70 % 가중 될 수 있지만, 정보가 제공되지 않았기 때문에 꼬리에 닿았을 때와 마찬가지로 정보가있을 확률은 50 %였습니다. 내가 그것을 배울 때 머리. 확률은 항상 (불충분 한) 데이터 세트에 대해 조건부이므로
    편집 : "항상"이 너무 강할 수 있습니다. 우리가 확률을 결정할 수없는 철학적 질문이있을 수 있습니다. 그러나 실제 상황에서 우리는 절대적인 확신을 가질 수는 없지만 "거의 항상"최선의 추정치가 있어야합니다.

1
'널 가설'이 다음과 같은 경우 과 같은 것, 즉 약간의 차이가 0이면이를 거부하면 H A : θ = 0 이라는 충분한 증거를 찾았 음을 의미합니다. 대신 H 0 과 같은 귀무 가설을 사용할 수 있습니다 . | θ | Δ 약간의 차이가 크지로 적어도이다,이다, Δ ( Δ는 당신이 발견 한 연구자가 그들에 대해 신경 작은 차이하다고 판단하는 것입니다), 그리고 거부 수단 H : | θ | <H0:θ=0H:θ=0H0:|θ|ΔΔΔ (즉 , < θ < Δ ). 동등성 테스트stats.stackexchange.com/tags/tost/infoH:|θ|<ΔΔ<θ<Δ
Alexis

실험의 힘 (및 실험 결과를 분석하는 통계 테스트)은 주어진 크기 이상의 효과가있는 경우 실험이 주어진 중요도 임계 값에서이를 탐지 할 확률입니다. statisticsdonewrong.com/power.html
Bennett Brown


당신의 동전 예제는 좋은 것입니다. 결과 만 알고 더 이상 가정하지 않으면 P (H0 | results)를 알 수 없습니다 . 주어진 던지기에서 머리가 확률 을 알고 동전의 특정 공정성을 가정합니다. 예. (그러나 이것은 가정을 감안할 때 가정적이며 가정이 사실인지 결코 알 수 없습니다 .) 이전의 여러 결과를 알고있는 동안 주어진 던지기에서 머리의 확률 을 알고 있습니까 ? 아니! 알고있는 이전 결과의 수는 중요하지 않습니다. 다음 던지기에서 확률 헤드를 정확히 알 수 없습니다 .
Sextus Empiricus

답변:


13

중요한 문제를 확실히 확인했으며 베이지안 문제를 해결하기위한 시도 중 하나입니다. 원하는 경우 정보가없는 사전을 선택할 수 있습니다. 다른 사람들이 Bayes 접근 방식에 대해 더 자세히 설명하도록하겠습니다.

그러나 상황의 대부분에서, 당신은 알고있다모집단에서 널이 거짓이면 효과가 얼마나 큰지 알 수 없습니다. 예를 들어, 사람의 체중이 SSN이 홀수인지 또는 짝수인지와 같은 완전히 우스운 가설을 세우고 어떻게 든 전체 인구로부터 정확한 정보를 얻는다면 두 가지 방법이 정확히 같지 않을 것입니다. 그것들은 (아마) 약간의 양이 다르지만 정확하게 일치하지는 않습니다. '이 경로를 사용하면 p 값과 유의성 테스트를 강조 표시하지 않고 효과 크기 및 정확도의 추정치를 보는 데 더 많은 시간을 할애합니다. 따라서 표본이 매우 큰 경우 SSN이 홀수 인 사람은 SSN이있는 사람보다 0.001 파운드가 더 많으며이 추정치의 표준 오류는 0.000001 파운드이므로 p <0.05이지만 아무도 신경 쓰지 않아야합니다.


1

1
효과 크기에 대한 좋은 지적. 질문이 본질적으로 부울 인 질병 검사와 같은 상황과 유사합니까?
Kalev Maricq

1
FWIW, 나는 사람의 체중과 그들의 SSN이 홀수인지 또는 짝수인지에 관계가 없다고 믿습니다. 관찰 연구에서, 이들 변수는 다른 변수들과 상관 관계가있어 궁극적으로 0이 아닌 한계 연관성이 존재한다. 나는 연구자들이 조사하기 위해 시간을 투자하는 대부분의 것들에 대해 0이 아닌 효과가 실제로 있다고 의심 할만한 이유가 있다고 생각한다.
gung-복직 모니카

1
@ gung 당신이 원하는 것을 믿을 수 있지만, 무게와 SSN 사이에는 분명히 제로가 아닙니다. 우리는 그 존재 이외의 관계에 대해 더 알고 있고 아마도 작을 수도 있습니다.
emory

1
나는 무게가 연속 변수라는 것을 알고 있습니다. 정수 킬로그램으로 기록 할 수도 있습니다. 귀하의 의견은 관찰 연구에 관한 것이 었습니다 (샘플을 기반으로 한 인구에 대한 추론 그리기). 내 연구는 가상의 달러로 자금을 조달하기 때문에 통계적 추론이 필요없는 무한 정밀도 척도를 사용하는 인구 연구입니다.
모리

3

이 질문에 답하려면 확률을 정의해야합니다. 귀무 가설이 참 (점 귀무 가설을 고려할 때 거의 없다는 것을 제외하고) 또는 거짓이기 때문입니다. 한 가지 정의는 내 데이터가 내가 고려하고있는 다른 가설에서 내 데이터가 발생할 가능성에 비해 내 데이터가 해당 가설에서 발생할 가능성에 대한 개인적 신념을 설명한다는 것입니다. 이 프레임 워크에서 시작하면 이전의 모든 정보를 기반으로하지만 현재 데이터를 제외하고 자신의 신념 만 생각하면됩니다.


좋은 지적. 나는 확률에 대한 나의 생각이 나의 개인적인 생각이 아니라 "완벽한 합리적 믿음"과 같은 것이라고 생각한다. 요점을 해결하기 위해 질문을 편집했습니다.
Kalev Maricq

2

핵심 아이디어는 느슨하게 말해서 경험적으로 무언가가 거짓임을 보여줄 수는 있지만 (반대 예를 제시하면 됨), 어떤 것이 확실하다는 것을 보여줄 수는 없습니다 (반대 예가 없음을 나타 내기 위해 "모든 것"을 테스트해야 함).

Falsifiability는 과학적 방법의 기초입니다. 당신은 이론이 맞다고 가정하고 그 예측을 실제 세계에서 관찰 한 것과 비교합니다 (예를 들어, Netwon의 중력 이론은 그것이 사실이라는 것을 알 때까지 "참"이라고 믿어졌습니다 극한 상황에서는 너무 잘 작동하지 않습니다).

P (results | null)이 낮 으면 데이터가 이론과 모순되거나 (또는 ​​운이 좋지 않은 경우) 귀무 가설을 기각하는 것이 합리적입니다. 실제로 null이 true라고 가정하고 P (null) = P (null | results) = 1이면 P (results | null)가 낮은 유일한 방법은 P (results)가 낮다는 것입니다 (행운).

한편, P (results | null)가 높을 때, 누가 알겠는가. 아마도 null이 false 일 수도 있지만 P (result)는 높으므로 더 나은 실험을 설계하는 것 외에는 아무것도 할 수 없습니다.

다시 한 번 말씀 드리겠습니다. 귀무 가설이 (거의) 거짓임을 보여줄 수 있습니다. 따라서 대답은 두 번째 포인트의 절반이라고 말하고 싶습니다 .P (results | null)가 null을 거부하기 위해 낮을 때 P (null | results)를 알 필요는 없지만 null이 사실이라고 말할 수는 없습니다 .P (결과)가 높다.

이것이 재현성이 매우 중요한 이유이기도합니다. 5 개 중 5 번은 운이 좋지 않은 것 같습니다.


"여러분은 실증적으로 무언가를 보여줄 수 있습니다"가설의 기각은 수용과 비슷하게 문제가된다고 생각합니다. p- 값이 귀무 가설이 거짓 일 확률과 같지 않습니다. 그렇지 않으면 OP에 대한 Alexis의 의견에서 | result |> a를 정의 할 수 있습니다. 결과를 관찰 할 때 반대의 예를 찾아서 거짓임을 증명하십시오 <a. 이와 같이 H a l t e r n a t i v e : | result | <a를 나타내는 것은 사실이다. H0:H이자형아르 자형나는V이자형:
Sextus Empiricus

Martijn에 동의합니다. 귀무 가설이 거짓 일 확률을 결정하는 방법을 알려 주면 제 질문에 대한 성공적인 답변이라고 생각합니다.
Kalev Maricq

μ1000(μ1000=3.50)

2

-------------------------------------------------- ---------------------

(편집 : 나는이 질문에 내 의견의 버전을이 답변의 맨 위에 놓는 것이 훨씬 짧을 것이므로 유용 할 것이라고 생각합니다)

p (a | b)의 비대칭 계산은 p (가설)와 같은 인과 관계로 볼 때 발생합니다. 이 계산은 양방향으로 작동하지 않습니다. 가설은 가능한 결과의 분포를 야기하지만 결과는 가설의 분포를 유발하지 않습니다.

P (가설)는 인과 관계 가설-> 결과에 근거한 이론 값이다.

p (a | b)가 상관 또는 관측 된 빈도 (필수 원인 일 필요는 없음)를 나타내면 대칭이됩니다. 예를 들어, 스포츠 팀이 이기고 잃은 게임 수와 스포츠 팀이 경기 테이블에서 2 골 이상 득점 / 골을 기록한 경우. 그런 다음 P (win | score> 2) 및 P (score> 2 | win)는 유사한 실험적 / 관측적인 (이론적 아님) 객체입니다.

-------------------------------------------------- -------------------

매우 단순한

표현 P (가설)는 너무 단순 해 보이기 때문에 간단히 용어를 뒤집을 수 있다고 생각하게합니다. 그러나 '결과'는 확률 분포 (가설을 제공함)를 갖는 확률 론적 변수입니다. 그리고 '가설'은 (일반적으로) 확률 변수가 아닙니다. '가설'을 확률 변수로 만들면 다른 결과의 확률 분포와 동일한 방법으로 가능한 다른 가설의 확률 분포를 의미합니다. (결과는 우리에게이 가설의 확률 분포를 제공하지 않으며, 베이 즈 정리를 통해 분포를 변경하기 만합니다)


빨강 / 파랑 구슬이 50/50 비율의 꽃병에 10 개의 구슬을 그립니다. 그러면, P (결과 실험)와 같은 것을 쉽게 표현할 수 있지만, P (화병 실험)을 표현하는 것은 의미가 없다. 결과는 다른 가능한 꽃병 실험의 확률 분포가 아닙니다.

여러 종류의 꽃병 실험이 가능한 경우, P (화병 실험 유형)과 같은 표현을 사용하고 Bayes 규칙을 사용하여 P (화병 실험 유형)를 얻을 수 있습니다. 꽃병 실험은 확률 변수입니다. (주 :보다 정확하게는 P (화병 실험의 종류 및 화병 실험의 종류의 분포))

그럼에도 불구하고,이 P (화병 실험 유형)는 주어진 초기 분포 P (화병 실험 유형)에 대한 (가설) 가설을 필요로한다.


직관

아래의 표현은 한 방향을 이해하는 데 도움이 될 수 있습니다.

X) X에 대한 가설이 주어지면 X의 확률을 표현할 수 있습니다.

그러므로

1) 결과에 대한 가설이 주어지면 결과에 대한 확률을 표현할 수 있습니다.

2) 우리는이 가설들에 대한 (가설) 가설이 주어진 가설의 확률을 표현할 수 있습니다.

베이 즈 규칙은 우리가 (1)의 역을 표현할 수 있도록하지만 (2)가 필요합니다. 가설은 확률 변수가되어야합니다.


솔루션으로 거부

따라서 우리는 결과가 주어진 가설에 대한 절대 확률을 얻을 수 없습니다 . 그것은 인생의 사실이며,이 사실과 싸우려고 노력하면 만족스러운 답변을 찾지 못하는 것 같습니다. 만족스러운 답을 찾는 해결책은 다음과 같습니다. 가설에 대한 (절대) 확률을 얻을 수 없다는 것을 받아들입니다.


상용 주의자

가설을 수용 할 수없는 것과 같은 방식으로, P (가설)가 0에 가까울 때 가설을 (자동으로) 거부해서는 안됩니다. 그것은 단지 우리의 신념의 변화를지지하는 증거가 있다는 것을 의미하며 우리의 새로운 신념을 어떻게 표현해야하는지 P (결과)와 P (가설)에 달려 있습니다.

빈번한 사람들이 거부 계획을 가지고 있으면 괜찮습니다. 그들이 표현하는 것은 가설이 참인지 거짓인지, 또는 그러한 경우에 대한 가능성은 아닙니다. 그들은 (사전없이) 그렇게 할 수 없습니다. 그들이 대신 표현하는 것은 그들의 방법의 실패율 (자신감)에 관한 것입니다 (특정 가정이 주어진 경우).


전능

이 모든 것을 얻을 수있는 한 가지 방법은 확률 개념을 설명하는 것입니다. 꽃병에 100 개의 구슬이 모두 모여 있으면 가설에 대한 특정 진술을 표현할 수 있습니다. 따라서 전지구 적이되고 확률의 개념이 관련이 없다면 가설이 참인지 아닌지를 말할 수 있습니다 (확률도 방정식에서 벗어 났음에도 불구하고).


꽃병 예가 의미가 있습니다. 그러나 실제 생활에서는 꽃병에 각 색상의 구슬이 몇 개나 있는지 거의 알지 못합니다. 나는 항상 "파란색보다 더 많은 붉은 구슬이 있습니까?"와 같은 질문으로 자신을 찾습니다. 내 데이터는 꽃병에서 4 개의 붉은 구슬과 1 개의 푸른 구슬을 그렸습니다. 이제는 "~ 100 개의 구슬이 있고 각각의 구슬이 빨강 또는 파랑 일 확률이 50 % 일 것"과 같은 가정을 할 수 있지만 실제 생활에서는 종종 임의적이고 비원 형적으로 얻는 방법에 대한 손실을 발견합니다. 이러한 사전.
Kalev Maricq

그것은 확률에 관한 문제보다 인식 론적 질문입니다. P (가설)와 같은 표현은 "거짓"과 비슷한 방식으로 가설적인 표현입니다. '현실'에 대한 특정 가설이 있다고 생각할 때 결과의 확률을 표현할 수 있습니다 . 실험 결과에 대한 확률이 가정과 같은 방식으로, 어떤 이론의 확률에 대한 표현 (결과의 일부 관찰 유무에 관계없이)은 '현실'에 대한 어떤 가상의 신념이 필요합니다. 예, 사전은 다소 임의적입니다. 그러나 가설도 마찬가지입니다.
Sextus Empiricus

확률에 대해 이야기합니다. 베이 즈 규칙은 P (a | b) P (b) = P (b | a) P (a)의 두 가지 확률 변수에 관한 것입니다. 조건부 확률을 연관시킬 수 있습니다. 만약 '이론이 결과의 분포를 초래한다'에서와 같이 이들 P (b | a) 중 하나가 인과 관계라면, 그것을 정확하게 계산할 수 있습니다. 이러한 경우는 (1 방향) 인과성 때문입니다. 가설을 통해 필요한 모든 것, 꽃병의 구슬을 알 수 있습니다. 다른 방법으로는 작동하지 않습니다. 실험 결과 4 빨강 대 1 파랑 은 꽃병에 구슬이 분포 될 가능성을 유발 하지 않습니다 .
Sextus Empiricus
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.