귀무 가설 하에서 교환 가능한 샘플의 직관은 무엇입니까?


15

순열 검정 (랜덤 화 검정, 재 랜덤 화 검정 또는 정확한 검정이라고도 함)은 매우 유용하며, 예를 들어 요구되는 정규 분포 가정이 t-test충족되지 않고 순위에 따라 값을 변환 할 때 유용합니다. 비모수 테스트 Mann-Whitney-U-test는 더 많은 정보가 손실 될 수 있습니다. 그러나 이러한 종류의 테스트를 사용할 때 단 하나의 가정 만 간과해서는 안됩니다. 귀무 가설 하에서 샘플의 교환 가능성을 가정합니다. coinR 패키지 에서 구현 된 것과 같은 두 개 이상의 샘플이있을 때 이러한 종류의 접근 방식을 적용 할 수도 있습니다 .

이 가정을 설명하기 위해 비 유적 언어 나 개념적인 직관을 일반 영어로 사용할 수 있습니까? 이것은 나와 같은 통계가 아닌 사람들 사이에서 간과 된이 문제를 명확히하는 데 매우 유용합니다.

참고 :
순열 테스트 적용이 동일한 가정 하에서 유효하지 않거나 유효하지 않은 경우를 언급하는 것이 매우 유용합니다.

업데이트 :
지구 내 지역 클리닉에서 50 명의 피험자가 무작위로 수집되었다고 가정합니다. 그들은 1 : 1 비율로 약물이나 위약을 무작위로 배정 받았다. Par1V1 (기준선), V2 (3 개월 후) 및 V3 (1 년 후)에서 매개 변수 1 에 대해 모두 측정되었습니다 . 피처 A를 기준으로 50 명의 피험자를 모두 2 개의 그룹으로 분류 할 수 있습니다. 양수 = 20 및 A 음수 = 30. 피처 B를 기준으로 다른 두 그룹으로 하위 그룹화 될 수도 있습니다. B 양성 = 15 및 B 음성 = 35.
이제 Par1모든 방문에서 모든 주제의 가치가 있습니다. 교환 가능성을 가정 Par1하여 다음
과 같은 경우 순열 테스트 사용 수준을 비교할 수 있습니까?
특징 A를 가진 피험자와 V2에 특징 B를 가진 피험자를 비교 하시겠습니까?
-V2에 A 기능이있는 피사체와 V3에 기능 A가있는 피사체를 비교합니까?
-어떤 상황에서이 비교가 유효하지 않으며 교환 가능성 가정을 위반합니까?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
루스 리프 용지 한 장에 각각 관찰 한 결과, 스택을 건네면서 미끄러 져 시트가 바닥에 닿으면서 사방으로 날아 갔다고 가정 해 봅시다. 해당 데이터에 대해 수행하고자하는 테스트의 유효성이 손상되면 부끄러운 일입니다. 관찰 결과를 교환 할 수 있고이를 바탕으로 테스트를 적용하는 경우, 저를 위로하고 바닥에서 종이를 모으는 것을 도와 주면서 걱정하지 않아도됩니다. 그렇지 않으면 데이터 수집이 특히 비싸면 평생 실행해야 할 수도 있습니다.
추기경

2
반면에 순서 시계열 데이터 (일반적으로)와 같은 문제에 중요하며 테스트는 일반적으로 적절한 순서로이 순서를 존중해야합니다.
추기경

@ cardinal, 당신의 직관적 인 이야기는이 가정이 어떻게 생겼는지에 대한 생생한 그림을 그렸지만, 타락한 소중한 종이가 교환 가능한지 여부를 판단하는 방법으로 여전히 혼란 스럽습니다. 가능하다면 다른 의견을 보내실 수도 있습니다!
박사 학위

답변:


7

에프엑스와이(엑스=1,와이=,=2)=에프엑스와이(엑스=,와이=2,=1)등). 그렇지 않은 경우 각 순열의 가중치 (확률 / 밀도)가 다르므로 순열 계산은 귀무 가설을 검정하는 올바른 방법이 아닙니다. 순열 테스트는 주어진 숫자 집합의 각 할당에 따라 다릅니다. 는 동일한 밀도 / 확률을 가진 변수에 값 .

에프(엑스1=1,엑스2=2,엑스=삼...엑스=)에프(엑스1=,엑스2=1,엑스=2 ...엑스=1)


교환 가능성은 잘 설명되어 있지만 +1이지만, 여전히 연구에 항아리 은유를 적용하려고 시도하면서 우연히 발견되었습니다. (질문의 업데이트를 참조하십시오). 방문 기간 및 기능에 따른 하위 그룹화를 고려할 때 이러한 값의 비교가 교환 가능한지 여부를 어떻게 판단 할 수 있습니까?
박사 학위

@doctorate : Par1의 결과와 관련된 요인으로 그룹을 계층화하는 것처럼 들립니다. 맞습니까? 특정 A / B feture 사분면 내에서 순열을 사용하는 한, 주제를 교환 할 수 있다고 가정합니다. 교환 기능에 의존하는 테스트를 사용하려면 기능을 가로 지르는 첫 번째 테스트를 추가로 처리해야합니다. 특히, 치료 효과를 정량화하고 특징 A와 B의 혼란스러운 효과를 교정해야합니다. 그렇지 않으면, goup 크기가 전체 결과 (심슨 역설)에 영향을 미칩니다

1
@doctorate : 나는 위의 의견이 당신이 원하는 것과 같은 경사 일 수 있음을 깨달았습니다 : 귀하의 경우 항아리는 기능의 쌍이 될 것입니다 (예 : (A +, B +), (A-, B +), (A +, B) -), (B-, A-) 총 4 개의 "jar". 그것이 좀 더 구체적으로 만드는 데 도움이됩니까?

Tks, 그러나 저와 같은 비 통계 학자들을 혼란스럽게하는 것은이 가정이 충족되었는지 아닌지를 어떻게 판단 할 수 있습니까? 예를 들어, 정규성을 위해 Shapiro-Wilk 테스트가 있습니다. 그러나 어떤 테스트가 교환 성을 검사하는지 궁금합니다. 그렇지 않으면 매우 어렵거나 모호한 정의가 될 수 있으며 두 통계학자가이 하위 그룹에 동의하지 않을 수 있습니다. 언급했듯이 A / B 사분면 내에서는 문제가 없지만 Drug / Placebo 내에서는 약간의 우려가있었습니다. 이 가정에 대한 산 테스트가 있습니까?
박사 학위

2
교환성에 관한 한 교환성에 대한 "테스트"는 없습니다. 달리 독립 (검증 인), exchangability 더 모델링 가정의되어 있었다 당신이 가지고 간처럼 반복 샘플을 가지고, 당신은 찾아 낼 것입니다 시간의 각 순열가 발생할 수있는 정확히 같은 부분이. 하나의 샘플 만 있으므로 "테스트"할 수 없습니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.