이 인용에서 Fisher는 무엇을 의미합니까?


14

나는이 유명한 인용문을 어디서나 계속 보지만, 강조된 부분을 매번 이해하지 못한다.

의미가 1 % 이상일 때 습관적 관행의 문제로 가설을 임시로 거부하는 사람은 그러한 결정의 1 % 이하로 오인 될 것입니다. 가설이 올 바르면 이러한 경우의 1 %만으로 오인 될 수 있으며, 틀린 경우 거부하지 않을 것입니다. [...] 그러나 계산은 터무니없이 학문적입니다. 사실 과학 과학자는 해마다 고정 된 수준의 중요성을 가지지 않으며 모든 상황에서 가설을 거부합니다. 그는 자신의 증거와 아이디어에 비추어 각각의 특정한 경우에 마음을 바칩니다.시험 적용을 위해 선택된 사례는 명백히 엄선 된 세트이며, 선택 조건은 한 명의 근로자에 ​​대해서도 명시 될 수 없다는 것을 잊어서는 안된다. 또한 사용 된 논거에서 특정 시련에 의해 지시 된 실제 수준의 중요성을이 수준 만 사용하는 것이 그의 평생 습관 인 것처럼 선택하는 것은 명백히 불법 일 것이다.

(통계 학적 방법 및 과학적 추론, 1956, p. 42-45)

더 구체적으로, 나는 이해하지 못한다

  1. 테스트를 "높은 선택"을 적용하기 위해 선택한 이유는 무엇입니까? 특정 지역의 사람들의 평균 키가 165cm 미만인지 궁금해하고 테스트를 수행하기로 결정하십시오. 내가 아는 한 표준 절차 는 해당 영역에서 임의의 샘플을 추출하여 높이를 측정하는 것입니다. 어떻게 이것을 높게 선택할 수 있습니까?
  2. 사례가 많이 선택되었다고 가정하지만, 이는 유의 수준 선택과 어떤 관련이 있습니까? 위의 예를 다시 생각해보십시오. 샘플링 방법 (Fisher 가 선택 조건이라고 함 )이 왜곡되어 어떻게 든 키가 큰 사람들을 선호하는 경우 전체 연구가 망쳐지고 유의 수준에 대한 주관적인 결정으로 저장할 수 없습니다.
  3. 실제로, 나는 "특정 재판이 나타내는 실제 수준의 중요성"이 무엇인지조차 모른다. 그것은 실험 의 값입니까, 유명한 0.05와 같은 사전 설정 값입니까, 아니면 다른 것입니까?

답변:


15

피셔가 당신의 대담한 말로 말한 것에 대한 나의 역설이 여기 있습니다. 한 사람의 결정에도 불구하고 모든 것을 지정할 수 없도록 테스트 할 가설을 선택하는 데 많은 부분이 있다는 것을 잊어서는 안됩니다. 또한 위에서 언급 한 이유로 평생 긴 습관과 같은 방식으로 특정 재판의 중요성 수준을 결정할 수 없다는 사실을 잊어서는 안됩니다.

  1. 과학적 가설은 연구원의 편견과 그들의 현재 지식 상태로 인해 다른 많은 경쟁 가설에 대해 테스트 할 가치가있는 것으로 선정되었습니다. 가설이 아닌 샘플을 "매우 선택"된다 가설은 우리가 시험에 적용되는 경우이다.

  2. 가설의 선택 과정은 우리의 중요성 수준에 영향을 미칩니다. 우리가 가설을 매우 확신한다면, 의미 수준을 덜 엄격하게하여 우리 자신을 만족시켜야합니다. 확실하지 않은 경우 증거 부담이 더 큽니다. 약물 시험에서 I 형 오류가 II 형보다 악화되는 등 다른 요인도 작용합니다.

  3. 나는 그가 "표시하다"라고 말할 때 단순히 "선택"을 의미한다고 생각한다. 예, p- 값이 더 극단적 인 경우 가설을 기각하는 사전 설정 값입니다.


10

Fisher가 언급 한 사례는 관찰이 아니라 테스트입니다. 즉, 테스트 할 가설을 선택합니다. 우리는 무작위 가설을 테스트하는 것이 아니라 관찰, 문헌, 과학 이론 등에 기초합니다.

당신이 경우 테스트 임의 가설을 다음 횟수는 1 %가 될 것입니다 (견적의 첫 번째 문장) 착각 (또는 무엇이든 값이 선택된다). 예를 들어 다음과 같은 가설을 테스트했다면

  • 개인의 사회 보장 번호의 패리티는 그의 IQ와 관련이 있습니다

  • 금발 머리 사람들은 어두운 머리 사람들보다 프리즈 비를 더 잘 던졌습니다.

  • Cross Validated에 대한 답변을 얻는 시간은 이름의 음절 수와 관련이 있습니다.

그리고 그것들 전부를 1 %에서 테스트했는데, 우리는 시간의 약 1 %를 null로 거부하고 잘못했습니다. (물론, 나는 위의 말이 아닌 무언가를 계속하고 있습니다).

나는 머리 색깔과 프리즈 비 던지기에 관한 기사를 한 번 보았습니다. 그래서 저는 이런 종류의 것을 "Frisbee research"라고 부릅니다.

그러나 내가 인용에서 가장 좋아하는 부분은 다음과 같습니다.

실제로 과학 과학자는 해마다 고정 된 수준의 중요성을 가지고 있지 않으며, 모든 상황에서 가설을 기각합니다. 그는 자신의 증거와 아이디어에 비추어 각각의 특정한 경우에 마음을 바칩니다.

그는 무덤에서 돌아 가야합니다.


4
이것은 좋은 대답이지만 "Frisbee research"를 나쁜 것으로 보는 것을 망설이고 있습니다. 방법론이 효과 크기 등을 고려하여 올바르게 사용되는 한 결과는 그럴듯하다고 생각합니다. 머리 색깔은 프리즈 비 던지기와 아무 관련이 없다고 믿지만 지구는 수백 년 전까지 우주의 중심에 있다는 것이 받아 들여졌습니다! 우리는 사람들이 잘못한 것에 대해 비난 할 수 있지만 질문을하는 사람을 비난해서는 안됩니다. 즉, 일부 가설은 다른 가설보다 유용 하지 않지만 여전히 정확할 수 있다는 데 동의 합니다 .
nalzok

그리고 그들은 또한 제 1 종 오류 일 수 있습니다.
Peter Flom-Monica Monica 복원

1
관련 : xkcd.com/882
jkdev

2

따옴표의 배경을 보려고 노력하면서 나는 약간 다른 따옴표가있는 책의 버전 (어떤 버전인지 확실하지 않습니다)에 왔습니다.

https://archive.org/details/in.ernet.dli.2015.134555/page/n47

옳고 그름에 근거한 가능한 진술의 가설 빈도를 참조하여 과학 연구에서 유의성 테스트의 코 그런시를 설명하려는 시도는 그러한 테스트의 본질적인 특성을 놓친 것 같습니다. 의미가 1 % 이상일 때 습관적 관행의 문제로 가설을 일시적으로 "거부"하는 사람은 그러한 결정의 1 % 이하로 오인 될 것입니다. 가설이 올 바르면 이러한 경우의 1 %만으로 오인 될 수 있으며, 틀린 경우 거부하지 않을 것입니다. 따라서이 불평등 진술을 할 수 있습니다. 그러나 계산은 터무니없이 학문적입니다. 실제로 과학 작업자는 해마다 일정한 수준의 중요성을 갖지 않으며 모든 상황에서 그는 가설을 기각한다. 그는 자신의 증거와 아이디어에 비추어 각각의 특정한 경우에 마음을 바칩니다. 또한, 계산은 증거에 비추어 볼 때 종종 사실이 아닌 것으로 추정되는 가설에 근거한 것이므로 그러한 문구가 어떤 의미를 갖는 것으로 가정하면 잘못된 결정의 실제 확률은 다음과 같습니다. 유의 수준을 지정하는 빈도보다 훨씬 적습니다. 가설을 기각하는 실무자에게는 물론 가설을 허위로 받아 들일 수있는 확률과 무관심의 문제입니다. 어떤 구절이 어떤 의미를 갖는 것으로 가정하면 잘못된 결정의 실제 확률은 유의 수준을 지정하는 빈도보다 훨씬 적을 수 있습니다. 가설을 기각하는 실무자에게는 물론 가설을 허위로 받아 들일 수있는 확률과 무관심의 문제입니다. 어떤 구절이 어떤 의미를 갖는 것으로 가정하면 잘못된 결정의 실제 확률은 유의 수준을 지정하는 빈도보다 훨씬 적을 수 있습니다. 가설을 기각하는 실무자에게는 물론 가설을 허위로 받아 들일 수있는 확률과 무관심의 문제입니다.

이것은 거부 가능성, 유형 I 오류의 수학적 표현을 엄격한 논증으로 사용한다는 비판으로 보입니다. 이러한 표현은 종종 관련성에 대한 좋은 표현이 아니며 엄격하지도 않습니다.

  1. 테스트를 "높은 선택"을 적용하기 위해 선택한 이유는 무엇입니까?

    이것은 문장과 관련이있는 것 같습니다

    또한, 계산은 증거에 비추어 볼 때 종종 사실이 아닌 것으로 추정되는 가설에 기초합니다.

    우리는 테스트되고있는 가설에 무관심하지 않으며, 종종 테스트되고있는 가설은 사실로 여겨 지지 않습니다 .

  2. 이것은 유의 수준 선택과 어떤 관련이 있습니까?

    이것은 관련

    따라서 그러한 문구가 어떤 의미를 갖는 것으로 가정하면 잘못된 결정의 실제 확률은 유의 수준을 지정하는 빈도보다 훨씬 적을 수 있습니다.

    p- 값은 귀무 가설 참일 때 실수하는 빈도입니다 . 그러나 실수를하는 실제 빈도는 다를 수 있습니다 (더 낮음).

  3. "특정 재판으로 표시된 실제 유의 수준"이란 무엇입니까?

    이 부분은 일종의 p- 값 해킹과 관련이 있다고 생각합니다. 관측 된 p- 값과 일치시키기 위해 관측이 발생한 후 유의 수준 α를 변경하고 처음부터 끝까지 컷오프 값인 척합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.