관찰 된 데이터 (일명 낚시 원정)와 일치하도록 가설을 변경하고 제 1 종 오류의 증가를 피할 수 있습니까?


32

연구자들은 가설을 형성하기 전에 기존 데이터 와 연구를 관찰하고 탐색 한 다음 그 가설을 검정하기 위해 데이터를 수집하는 데 시간소비 해야한다는 것이 잘 알려져 있습니다 (널-가설 유의성 테스트 참조). 많은 기본 통계 책은 가설 이 선험적 으로 형성되어야하며 데이터 수집 후 변경 될 수 없다고 경고합니다 . 그렇지 않으면 방법론이 무효가됩니다.

나는 하나의 이유는 왜 관측 데이터에 맞게 가설을 변경하는 문제가 이해 때문에 때문에 가짜 데이터 유형 I 오류를 범할 큰 기회입니다,하지만 내 질문은 : 인 것으로 가는 다른 근본적인 문제가있는 이유 또는 낚시 원정에?

보너스 질문으로, 잠재적 함정에 자신을 노출시키지 않고 낚시 원정을 시작할 수있는 방법이 있습니까? 예를 들어 데이터가 충분하면 데이터의 절반에서 가설을 생성 한 다음 다른 절반을 사용하여 테스트 할 수 있습니까?

최신 정보

내 질문에 관심을 가져 주셔서 감사합니다. 그러나 답변과 의견은 주로 내가 배경 정보로 설정 한 것으로 생각 된 것을 목표로합니다. 나는이 있는지 알고 관심이 다른 이유는 왜 가짜 결과의 높은 가능성을 넘어 그것의 나쁜 같은 분할 데이터와 같은 방법, 가설 변화의 첫 번째가있는 경우 사후 하지만, 유형 I 오류의 증가를 피하는.

내 질문의 추진력을 반영하여 제목을 업데이트했습니다.

감사합니다. 혼란을 드려 죄송합니다.



1
과학적 방법의 본질은 가설을 세운 다음 이론이 될 수 있도록 위조하는 것입니다 (위조에 실패한 경우). 낚시 원정을 계속하는 것은 나중의 실험에서 위조 할만한 가설을 찾는 유효한 방법이지만 한 번에 가설을 위조하려고 할 수는 없습니다. 특히, 가설을 조정할 수 있다면 더 이상 위조하지 마십시오. 대신 조정하면 조정되지 않은 가설을 위조하고 새로운 가설을 형성하게됩니다.
Wrzlprmft 2016 년

@ jona, 그것은 훌륭한 종이입니다. 나는 이미 Ioannidis와 Schooler의 논문을 읽었지만 Simmons 은 그 문제를 훌륭하게 보여줍니다.
post-hoc

1
stat.columbia.edu/~gelman/research/published/multiple2f.pdf 에서 귀하의 질문과 관련이이 문서를 찾을 수 있는지 궁금합니다 . 그것은 정확히 같은 주제에 있지는 않지만 한 가지 측면을 다룹니다.
a11msp

1
데이터로 인해 가설이 변경 될 수 있지만 새 가설을 확인하려면 처음부터 새 데이터 수집을 시작해야합니다.
keshlam

답변:


54

확실히 당신은 그것이 낚시 원정 임을 인정 하고 그렇게 취급하는 한 낚시 원정 에 갈 수 있습니다 . 더 좋은 이름은 "탐사 데이터 분석"입니다.

더 나은 유추는 대상에서 촬영하는 것일 수 있습니다.

목표물을 쏴서 황소 눈에 부딪히면 축하 할 수 있습니다.

당신은 총의 속성을 테스트하기 위해 대상없이 촬영할 수 있습니다.

그러나 벽을 쏘고 총알 구멍 주위에 대상을 페인트하는 것은 속임수입니다.

이에 대한 일부 문제점을 피하는 한 가지 방법은 학습 데이터 세트에서 탐색 한 후 별도의 "테스트"데이터 세트에서 테스트하는 것입니다.


13
피터의 대답을 개선하기는 어렵습니다. 많은 데이터 준설에 대한 불행한 문제는 저자가 가설을 완전히 사전에 지정하지 않았거나, 즉 '탐사'라는 용어를 사용하지 않았다는 입장이 없다는 점이다. 많은 연구자들이 출판 가능한 논문을 얻기 위해 데이터를 준설하고 있으며 검증 시도를 따르지 않습니다 (종종 실망 스럽습니다).
Frank Harrell

2
Frank Harrell의 의견을 한 걸음 더 나아가 : 일부 데이터를 탐색하고 흥미로운 결과를 출판하는 것은 합법적입니다. 흥미롭고 탐구적인 결과는 재생산 / 검증 될 수 있습니다. 단점은 다른 사람이 당신의 발견을 확인하면 영광을 얻을 수 있고 다른 사람들이 당신의 결과를 확인하지 않으면 당신은 가짜 상관 관계에 빠진 것입니다. 자존심이 크면 나빠요. 말할 것도없이 데이터와 절차를 공개해야하는데, 많은 분야의 실무자들은 그렇지 않습니다. 그리고 계속 진행하기보다는 새로운 데이터를 추적해야합니다.
Wayne

11
+1But it's cheating to shoot at a wall and then paint a target around the bullet hole.
WernerCD

3
@ post-hoc 잘, 그것은 눈썹을 올리지 않아야 하지만, 그럴 수도 있습니다. 눈썹 아래에있는 사람의 눈에 따라 다릅니다!
Peter Flom-Monica Monica 복원

2
Texas Sharpshooter Fallacy ..
smci

25

낚시 원정의 문제점은 이것입니다. 충분한 가설을 테스트하면 그 중 하나가 낮은 p 값으로 확인됩니다. 구체적인 예를 들어 보겠습니다.

역학 연구를하고 있다고 상상해보십시오. 드문 상태로 고통받는 1000 명의 환자를 발견했습니다. 공통점이 무엇인지 알고 싶습니다. 따라서 테스트를 시작합니다.이 샘플에서 특정 특성이 과다 표현되는지 확인하려고합니다. 처음에는 성별, 인종, 특정 가족력 (50 세 이전에 심장병으로 사망 한 아버지 등)을 테스트하지만 결국 "고착 된"것을 찾는 데 어려움을 겪으면서 다른 모든 요인을 추가하기 시작합니다. 질병과 관련이 있을 수 있습니다 :

  • 채식주의 자
  • 캐나다로 여행했다
  • 완성 된 대학
  • 결혼 한
  • 아이들이있다
  • 고양이가있다
  • 개가있다
  • 주당 최소 5 잔의 적포도주를 마신다

자 여기 있습니다. 충분한 "무작위"가설을 선택하면, 이들 중 적어도 하나가 0.05보다 작은 p 값을 초래할 가능성이 높아지기 시작합니다. 효과가 없습니다. " 다르게 평균적으로, 당신이 테스트하는 20 개의 가짜 가설마다, 그들 중 하나는 <0.05의 ap를 줄 것입니다 .

이것은 XKCD 만화 http://xkcd.com/882/ 에 아주 잘 요약되어 있습니다 .

여기에 이미지 설명을 입력하십시오

비극은 개별 저자가 중요성을 찾기 위해 표본에 대해 20 개의 다른 가설 테스트를 수행하지 않더라도 19 명의 다른 저자가 같은 일을 할 수 있다는 것입니다. 그리고 상관 관계를 "찾는"사람은 이제 흥미로운 논문을 작성하고 출판을 위해 받아 들여질 것입니다…

이는 재현 할 수없는 결과에 대한 불행한 경향이 있습니다. 개별 저자로서 이것을 막는 가장 좋은 방법은 막대를 높이는 것입니다. 개별 요인을 테스트하는 대신 "N 가설을 테스트 할 경우 적어도 하나의 오 탐지가 발생할 확률은 얼마입니까?" 실제로 "낚시 가설"을 테스트 할 때 Bonferroni를 수정 하여이를 방지 할 수는 있지만 사람들은 그렇지 않습니다.

Ioannides 박사의 흥미로운 논문이있었습니다. 특히이 주제 에 대해 대서양 월간에 소개되었습니다 .

몇 가지 통찰력있는 답변이있는 이 이전 질문 을 참조하십시오 .

질문의 모든 측면에 더 잘 반응하도록 업데이트 하십시오.

당신이 "낚시"를 두려워하지만 실제로 어떤 가설을 공식화해야할지 모른다면, 데이터를 "탐사", "복제"및 "확인"섹션에서 확실히 분리 할 수 ​​있습니다. 원칙적으로 이것은 앞에서 설명한 위험에 대한 노출을 제한해야합니다. 탐사 데이터에서 p 값이 0.05이고 복제 및 확인 데이터에서 유사한 값을 얻는 경우, 잘못 떨어질 위험이 있습니다. 영국 의학 저널 (British Medical Journal)에 "올바른 일"의 좋은 예가 나타났습니다

임신하지 않은 여성의 합병증없는 임신과 관련된 요인의 탐색 및 확인 : 전향 적 코호트 연구, Chappell et al

관련 단락은 다음과 같습니다.

5628 명의 여성 데이터를 세 부분으로 나누었다 : 무작위로 선택된 호주와 뉴질랜드 여성의 3 분의 2의 탐색 데이터 셋 (n = 2129); 호주 및 뉴질랜드 출신 여성의 나머지 3 분의 1의 국소 복제 데이터 세트 (n = 1067); 영국과 아일랜드에서 온 2432 명의 유럽 여성에 대한 외부의 지리적으로 구별되는 확인 데이터 세트.

Altman 등은 "예후 및 예후 연구 : 예후 모델 검증"이라는 제목 의 논문을 조금 더 살펴보면 훨씬 더 깊이 들어가고이를 피할 수있는 방법을 제안합니다. 이 오류. 기사의 "주요 점":

검증되지 않은 모델은 임상 실습에 사용하지 않아야합니다. 예후 모델을 검증 할 때는 교정 및 차별을 평가해야합니다. 모델을 개발하는 데 사용 된 데이터와 다른 데이터, 바람직하게는 다른 센터의 환자와 다른 데이터에 대한 검증을 수행해야합니다. 개발 방법의 결함으로 인해 또는 새 샘플이 원본과 너무 다르기 때문에

특히 다른 출처의 데이터를 사용하여 유효성 검사를 수행해야한다는 제안에주의하십시오. 즉, 데이터를 임의로 하위 집합으로 분할하는 것만으로는 충분하지 않지만 한 세트의 세트에서 "학습"을 입증 할 수있는 방법을 수행해야합니다. 실험 세트는 다른 실험 세트의 데이터에 적용될 수 있습니다. 이 수치는 더 높지만 설정에서 체계적인 편견이 독립적으로 확인할 수없는 "결과"를 생성 할 위험을 더욱 줄입니다.

매우 중요한 주제입니다. 질문 해 주셔서 감사합니다!


7
이 마음에 가져다 : xkcd.com/882
옌스

2
@ jens-그것은 내가 준 것보다 훨씬 더 설득력있는 설명입니다 ... 그 링크에 감사드립니다. 평소처럼 - 약간의 재치있는 대답에 대한 만화 위로 마우스를 가져가.
Floris

요 아니 데스와 레어 기사는 나를 여기로 데려온 길이었다. 귀하의 예는 @jona가 언급 한 Simmons 의 예와 유사합니다 . Type I 오류의 가능성 증가를 설명하는 매우 좋은 방법이지만, 이유 가 다른 이유가 있습니까?
post-hoc

1
일반적으로 데이터 준설의 문제점은 "원인"과 "상관"을 혼동시킬 위험이 있다는 것입니다. 먼저 합리적인 가설을 세운 다음 관찰 결과를 설명하는 데 도움이되는지 확인하면 두 가지를 혼동 할 위험이 줄어 듭니다. "빅 데이터"는 종종 다른 길을 간다 - 자신의 작업 방식은 "나는 충분한 데이터를 분석하면 내가 과거에 진정한 보유하고 미래에 보관합니다 패턴을 볼 것"입니다. 때로는 작동하지만 때로는 작동하지 않습니다. 통계는하지 않아야합니다 대체 단지 이제까지 - 사고와 이해에 대한 확인 .
Floris

6
주요 문제는 상관 관계와 인과 관계라고 생각하지 않습니다. 연관성이 복제되지 않음을 발견하기 만하면 상관 관계 분석을 쉽게 수행 할 수 있습니다.
Frank Harrell

5

이 질문은 낚시 원정과 함께 제공되는 제 1 종 오류 인플레이션 이외의 다른 문제 가 있는지 묻습니다 .

0

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.