“가설 검증”과“의미 검증”의 차이점은 무엇입니까?


17

"가설 검증"과 "의미 검증"이라는 문구 사이에 차이가 있습니까?

@Micheal Lew의 자세한 답변을받은 후 요즘 가설 (예 : t- 검정 평균)이 "유의성 검정"또는 "가설 검정"의 예라는 혼란이 있습니까? 아니면 둘 다의 조합입니까? 간단한 예를 통해 어떻게 차별화 할 수 있습니까?


3
학생의 t- 검정은 피셔의 유의성 검정 (p 값이 유의 수준임) 또는 Neyman-pearsonian 가설 검정 (p 값이 사전 설정 알파보다 작은 경우)에서 사용할 수있는 p 값을 제공하는 데 사용할 수 있습니다. 결과는 '유의 적'입니다). 차이점은 t- 검정에서 비롯된 생각의 학교보다는 t- 검정 결과로 수행되는 것입니다 (고셋의 접근 방식은 NP보다 Fisher와 공통점이 더 많음).
Michael Lew-

답변:


19

유의성 검정은 Fisher가 고안 한 것으로 가설 검정은 유의성 검정을 대체하기 위해 고안 한 것입니다. 그것들은 동일하지 않으며 대부분의 귀무 가설 검정 사용자를 놀라게 할 정도로 상호 호환되지 않습니다.

Fisher의 유의성 검정은 관측치가 귀무 가설 아래에 얼마나 극단적인지를 나타내는 p 값을 산출합니다. 이 p 값은 귀무 가설과 유의 수준에 대한 증거의 지표입니다.

Neyman과 Pearson의 가설 검정은 귀무 가설과 대립 가설을 모두 설정하고 귀무 가설을 수락하기위한 결정 규칙으로 작동합니다. 간단히 말해서 (여기에 넣을 수있는 것보다 더 많은 것이 있습니다) 당신은 수용 가능한 오 탐지율, 알파 (보통 0.05)를 선택하고 p 값이 알파보다 위인지 아래인지에 따라 널을 수락하거나 거부합니다. 위양성 오류로부터 보호하려면 통계 테스트의 결정을 따라야합니다.

Fisher의 접근 방식을 사용하면 결과를 해석 할 때 원하는 것을 고려할 수 있습니다. 예를 들어, 기존의 증거는 결과의 해석 및 표현에 비공식적으로 고려할 수 있습니다. NP 디자인에서는 실험 설계 단계에서만 수행 할 수 있으며 거의 ​​수행되지 않는 것 같습니다. 내 생각에 어부의 접근 방식은 NP의 접근 방식보다 기본적인 생물 과학 연구에 더 유용하다.

유의성 검정과 가설 검정 간의 불일치 및 불행한 하이브리드 화에 대한 실질적인 문헌이 있습니다. 이 논문부터 시작할 수 있습니다 : Goodman, 증거 기반의 의료 통계로. 1 : P 값 오류. http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371


2
@Micheal Lew-+1 나는 Newman / Pearson이 가설 테스트라는 구절을 만들었 음을 알지 못했고 좀 더 비공식적 인 방식으로 해석했다. 또한 오류를 수정하고 항상 피드백을 듣고 싶어하기 때문에 내 대답이 어떻게 잘못되었는지 자세히 설명해 주시겠습니까?
richiemorrisroe

2
@richiemorrisroe-네이 먼과 피어슨은 문구를 동전 이상으로 만들었습니다! 그들은 통계 분석에 대한 전체 패러다임을 고안했습니다. 오늘날 많은 분야 (내 의견과 피셔의 의견에도 불구하고)가 대부분의 과학 실험에 적합하지 않다는 패러다임입니다. Fisher는 NP 접근법이 산업 수용 테스트에만 관련이 있다고 반복해서 주장했다. 대부분의 입문 통계 텍스트에는 학생들이 통계 테스트에 대한 생각의 학교간에 중요한 차이점이 있음을 이해할 수 있도록 충분한 세부 사항 및 기록이 포함되어 있지 않습니다. 불행하다.
Michael Lew-복원 Monica Monica

0

많은 경우에,이 두 진술은 같은 것을 의미합니다. 그러나 그것들은 또한 상당히 다를 수 있습니다.

가설을 테스트하는 것은 먼저 어떤 현상에서 어떤 일이 발생한다고 생각하는지 말한 다음이 현상에 대한 일종의 테스트를 개발 한 다음 현상이 실제로 발생했는지 여부를 결정하는 것으로 구성됩니다. 대부분의 경우 가설 검정에는 모든 종류의 통계 검정이 필요하지 않습니다. 물리학자인 어니스트 러더 포드 (Ernest Rutherford)는이 인용문을 떠올리게됩니다. 만약 실험에 통계가 필요하다면, 더 나은 실험을했을 것입니다. 즉, 가설 검정은 일반적으로 일종의 통계 도구를 사용합니다.

반대로 유의성 테스트는 순전히 통계적인 개념입니다. 본질적으로 하나의 두 가설, 즉 귀무 가설은 두 개 (또는 그 이상)의 데이터 수집간에 차이가 없음을 나타냅니다. 다른 가설은 우연히 발생하지 않은 두 표본간에 차이가 있다는 것입니다.

연구의 설계에 따라 통계 테스트를 사용하여 두 개 이상의 샘플을 비교하여 숫자를 제공 한 다음 참조 분포 (예 : 정규 분포, t 분포 또는 F 분포)와 비교합니다. 이 검정 통계량이 임계 값을 초과하면 귀무 가설을 기각하고 두 개 이상의 표본간에 차이가 있다고 결론을 내립니다. 이 기준은 일반적으로 우연에 의한 차이의 확률이 20 분의 1 미만 (p <0.05)이지만 다른 것들은 때때로 사용되기도합니다.


가설 검정에 어떤 종류의 통계 검정도 포함되지 않는 몇 가지 예를 들어 주시겠습니까?
사랑 통계

이것은 유의성 검정과 가설 검정의 부정확 한 표현입니다.
Michael Lew-복원 Monica Monica

@ user152509 내가 특정 제품의 사용자와 비 사용자를 인터뷰하는 연구를 수행한다고 가정합니다. 비 사용자는 해당 제품의 단점에 초점을 맞추고 사용자는 제품이 어떻게 도움이되는지에 대해 이야기 할 것입니다. 이것이 내가 관찰 한 것이므로 가설은 통계없이 테스트되었습니다.
richiemorrisroe

2
과학적 가설과 통계적 가설을 구별하는 것이 중요합니다. 귀무 가설 통계 검정으로 검정 한 귀무 가설은 대개 후자입니다. 잘 설계된 통계적 가설을 테스트하면 과학적 가설에 관한 추론이 허용 될 수 있지만 항상 그런 것은 아닙니다.
Michael

@Micheal Lew, 요즘 가설 (예 : t- 검정 평균)이 "유의성 검정"또는 "가설 검정"의 예라는 혼란이 있습니까? 아니면 둘 다의 조합입니까? 간단한 예를 통해 어떻게 차별화 할 수 있습니까?
love-stats
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.