비모수 적 테스트 (예 : 순열 테스트)로 상호 작용 효과를 테스트하는 방법은 무엇입니까?


10

두 가지 범주 형 / 명목 형 변수가 있습니다. 각각은 두 개의 고유 한 값만 가질 수 있습니다 (따라서 총 4 개의 조합이 있습니다).

각 값 조합에는 일련의 숫자 값이 제공됩니다. 그래서 저는 4 개의 숫자를 가지고 있습니다. 그것을보다 구체적인하려면하자 우리는 내가 가진 말 male / femaleyoung / old와 명목 변수로 내가 가진 weight종속 수치 "출력"으로.

에서 male로 전환 female하면 평균 무게가 변경되며 이러한 변화는 통계적으로 중요 하다는 것을 알고 있습니다. gender요인을 계산할 수 있습니다 . age변수 에도 동일하게 적용됩니다 . 에서 young로 전환 old하면 평균 무게가 변경되고 해당 age계수를 계산할 수 있다는 것을 알고 있습니다 .

이제 데이터가 젊은 여성에서 노인으로의 전환이 성별 및 연령 요소의 조합보다 더 많은 것을 입증하는지 실제로보고 싶습니다. 다시 말해, 데이터가 "2D 효과"가 있다는 것을 증명하는지, 즉 연령 및 성별 효과가 독립적이지 않다는 것을 알고 싶습니다. 예를 들어, 남성의 나이가 증가하면 가중치가 1.3 배 증가하고 여성의 경우 해당 계수가 1.1이 될 수 있습니다.

물론 두 가지 언급 된 요인 (남성 연령 요인과 여성 연령 연령 요인)을 계산할 수 있으며 서로 다릅니다. 그러나이 차이의 통계적 유의성을 계산하고 싶습니다. 이 차이는 얼마나 실제적인가.

가능하면 비모수 적 테스트를하고 싶습니다. 네 세트를 섞고 섞고 무언가를 다시 나누고 계산하여 내가하고 싶은 일을 할 수 있습니까?


2
비모수 적으로 상호 작용을 다루는 데있어 한 가지 어려움은 반응의 단조로운 변환이 존재하는 상호 작용을 제거하거나 존재하지 않는 상호 작용을 유도하거나 상호 작용의 방향을 뒤집을 수 있다는 것입니다. 예를 들어 순위 기반 접근 방식이 예상 한대로 작동하지 않을 수 있음을 나타냅니다.
Glen_b-복지국 모니카

원래 변수에 대한 순열 테스트를 사용하면 문제가 없지만 상호 작용에 대한 정확한 테스트는 없습니다. 대략적인 테스트를받을 수 있습니다.
Glen_b-복지국 모니카

답변:


5

상호 작용에 대한 비모수 적 테스트가 있습니다. 대략적으로 말하면 관측 된 가중치를 순위로 바꾸고 결과 데이터 세트를이 분산 분석으로 처리합니다. 예를 들어 Brunner and Puri (2001)의 "요인 설계의 비모수 적 방법"을보십시오.

그러나 관심이있는 비모수 적 상호 작용의 종류는이 일반성에 표시 할 수 없습니다. 당신은 말했다 :

다시 말해, 데이터가 "2D 효과"가 있다는 것을 증명하는지, 즉 연령 및 성별 효과가 독립적이지 않다는 것을 알고 싶습니다. 예를 들어, 남성의 나이가 증가하면 가중치가 1.3 배 증가하고 여성의 경우 해당 계수가 1.1이 될 수 있습니다.

후자는 불가능하다. 비모수 적 상호 작용은 부호 변화를 포함해야합니다. 즉, 나이가 들면 남성의 체중은 증가하지만 여성의 체중은 감소합니다. 가중치를 단조 적으로 변환하더라도 이러한 부호 변경은 유지됩니다. 그러나 가중치 1.1만큼 가중치 증가를 1.3에 가깝게 매핑하는 데이터에서 단조로운 변환을 선택할 수 있습니다. 물론 원하는만큼 근접 할 수있는 경우 차이가 크게 표시되지 않습니다.

부호 변경이없는 상호 작용에 실제로 관심이 있다면 일반적인 파라 메트릭 분석을 고수해야합니다. "차이를 삼키는"단조로운 변환은 허용되지 않습니다. 물론 이것은 통계를 모델링하고 해석하여 명심해야 할 사항입니다.


1

당신은 나이, 성별의 효과가 더 단지 개별 효과보다 있다고 생각되면, 당신은 모델 고려할 수있다 γ이자형나는h나는=α이자형나는+β이자형이자형아르 자형나는+γ(이자형이자형아르 자형나는이자형나는).γ계수는 연령과 성별의 "2D"효과의 크기를 캡처합니다. 당신의 t 통계량 확인할 수 있습니다 여부에 거친 아이디어를 얻을 γ 당신이 모델의 관찰이 큰 차이가 γ = 0 .γγγ=0

다음은이 추가 곱셈 용어 인 가 수행 하는 작업 을 보여주는 매우 거친 그래픽 예 입니다.이자형이자형아르 자형나는이자형나는

모델 , 우리는 본질적으로 간단한 초평면을 데이터에 맞추려고 시도합니다.아르 자형이자형에스영형에스이자형=엑스1+엑스2

여기에 이미지 설명을 입력하십시오

이 모델은 공변량에서 선형이므로 위 그림에서 볼 수있는 선형 모양입니다.

다른 한편으로, 모델 x 1x 2 에서 비선형 이므로 어느 정도의 곡률을 허용합니다아르 자형이자형에스영형에스이자형=엑스1+엑스2+엑스1엑스2엑스1엑스2

여기에 이미지 설명을 입력하십시오

이라는 가설을 기각하지 못하는 것은 모형에이 형태의 곡률이 있다는 것을 기각하지 않는 것과 같습니다.γ=0

비모수 테스트와 관련하여 에 대한 부트 스트랩 표준 오류를 획득하여 제안한 내용에 따라 무언가를 수행 할 수 있습니다 . 이 수단, 여러 번 당신 : 1)), 교체로 2 데이터를 샘플링 선형 모드, 3) 추정 얻을 다시 계산 γ를 . 당신은 많은 추정이 후 γ를 , 당신이 사용할 수있는 50 ± 피의 %의 비 파라 메트릭 설정 분위수를 2 페이지 %에 대한 신뢰 구간 γ를 . 이에 대한 자세한 내용은 Google "bootstrap 표준 오류"를 참조하십시오.γγ^γ^50±%2%γ


x1과 x2가 0 또는 1의 값만 가질 수 있다면 어떻게 비선형 일 수 있습니까? 귀하의 예에서 감마는 어떤 형태의 곡률을 어떻게 설명합니까?
5ayat

도메인이 무엇인지는 중요하지 않습니다. 함수를 인수의 선형 조합으로 작성할 수 없기 때문에 여전히 비선형입니다 (예 : ). 두 번째로, 나는 "매우 거친 그래픽 예"라고 조심스럽게 말했습니다. 이것은 이진 경우의 연속적인 아날로그입니다. αR2:x1+x2+x1x2=i=12αix나는
Mustafa S Eisa

그러나 도메인이 2 진 (2D 큐브의 정점과 같음) 인 경우이 함수를 선형으로 처리 할 수 ​​있다고 덧붙입니다. 그러나 기능적 형태는 엄격히 비선형 적입니다.
Mustafa S Eisa

@MustafaMEisa, 나는 "2D 큐브의 정점"이라는 용어로 설명 된 선형 모델에서 상호 작용 항을 본 적이 없다. 정교하게 할 수 있다면 유익 할 것입니다.
5ayat

@ HorstGrünbusch, 이미 답변에 유용한 의견을 주었 으므로이 답변에 대한 귀하의 의견에 대해 궁금합니다.
5ayat

1

다른 사람들이 지적했듯이, 이것은 상호 작용으로 선형으로 모델링 될 수 있습니다. 두 개의 인형과 상호 작용하고 있으며 이것에 대해 비선형은 없습니다. 주어진 모델 : '성별'한계 효과는 부분 미분입니다.

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+이자형

성별과 연령이 0 또는 1의 값만 가질 수 있다면 어떻게 4 개의 다른 그룹의 평균 차이 만보고 있습니까? 즉, 우리는 단지 우리는 상기 식에 연결할 수 네 개의 서로 다른 조합이있다 : (1) 이자형이자형아르 자형=0 , (2) g e n d e r = 1 a g e = 1 , (3) g e n d e r = 0 a g e이자형=0gender=1age=1gender=0 이고 (4) g e n d e r = 1 이고 a g e = 0 입니다. 따라서 특정 예는 4 개의 그룹 평균을 비교하는 것과 같습니다.age=1gender=1age=0

보는 것도 도움이 될 것입니다 위의 두 개의 상호 작용 된 명목 변수가있는 분산 분석과 어떻게 동일한 지 이해 이 토론 . 특정 예를 사용하여 (연령과 성별의 조합이 4 개뿐이므로) 명시 적 상호 작용 항없이 다음과 같은 모델을 지정할 수도 있습니다.

wt=α+b1young.male+b2old.ma이자형+와이영형.에프이자형미디엄이자형+ϵ

여기서 는 참조 범주로 생략되며 계수 b 1o l d 간의 평균 차이가됩니다 .영형l.에프이자형미디엄이자형1 y o u n g . m a l e . 여기서 인터셉트 α o l d 내의평균 w t와 같습니다 . f를 전자영형.에프이자형미디엄이자형와이영형.미디엄이자형α (다시 말해서 참조 범주).영형.에프이자형미디엄이자형

자신의 데이터로 사용해보십시오. 교호 작용이있는 선형 모델, 교호 작용이있는 분산 분석 또는 교호 작용이없는 각 그룹에 더미를 사용하면 동일한 결과를 얻을 수 있습니다. 멋지다, 응? 통계 책은이 장들 각각에 대해 다른 장에서 다룰 것입니다 그러나 모든 길은 로마로 연결됩니다. 실제로 이것이 자신의 데이터와 어떻게 작동하는지 보는 것이 배우는 가장 좋은 방법 중 하나입니다.

따라서 위의 예는이 결론에 도달하기에는 너무 복잡한 방법이지만 (실제로 네 가지 그룹 평균을 비교하고 있음) 상호 작용이 작동하는 방식을 배우는 데 도움이된다고 생각합니다. CV에는 연속 변수를 공칭 변수와 상호 작용하거나 두 개의 연속 변수를 상호 작용하는 방법에 대한 다른 좋은 게시물이 있습니다. 비모수 적 검정을 지정하기 위해 귀하의 질문을 편집했지만 가설 검정에 대한 대부분의 비모수 적 접근 방식은 논리가 동일하지만 일반적으로 특정 분포에 대한 가정이 적습니다.

영형.미디엄이자형와이영형.영형미디엄이자형

"중요한"상호 작용에 대한 간단한 설명

엑스1엑스2엑스1엑스2그러나 0 또는 1의 값만 가질 수있는 두 개의 공변량 만 있다면, 우리는 본질적으로 4 개의 그룹 평균을보고 있음을 의미합니다.

작동 예

상호 작용 모델의 결과와 Dunn의 테스트 결과를 비교해 보겠습니다. 먼저 (a) 남성의 체중이 (b) 젊은 남성의 체중이 남성보다 적으며 (c) 젊은 여성과 노인 여성간에 차이가없는 데이터를 생성 해 보겠습니다.

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

한계 효과에 대한 표준 오차 또는 신뢰 구간을 계산해야합니까? 위에서 언급 한 '효과'패키지가이를 수행 할 수 있지만 Aiken and West (1991)는 훨씬 복잡한 상호 작용 모델에 대해서도 공식을 제공합니다. 그들의 테이블은 Matt Golder의 훌륭한 주석과 함께 여기 에 편리하게 인쇄되어 있습니다 .

이제 Dunn의 테스트를 구현합니다.

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

Kruskal-Wallis 카이 제곱 검정 결과의 p- 값은 우리 그룹 중 하나 이상이 '다른 인구에서 온'것으로 나타냅니다. 그룹 별 비교의 경우 상위 숫자는 Dunn의 z- 검정 통계량이고 하위 숫자는 p- 값이며 다중 비교를 위해 조정되었습니다. 예제 데이터가 다소 인공적인 것이 었으므로 작은 p- 값이 너무 많은 것은 놀라운 일이 아닙니다. 그러나 젊은 여성과 노인 여성의 오른쪽 아래 비교에 유의하십시오. 검정은이 두 그룹간에 차이가 없다는 귀무 가설을 올바르게 지원합니다.

업데이트 : 다른 답변이 주어지면이 답변은 어떤 형태의 비선형 모델링이 필요하다는 아이디어 또는 두 개의 이진 공변량 (예 : 네 개의 그룹)에 대한 OP의 특정 예를 감안할 때 이를 비모수 적으로 평가하기위한 부호 변경. 예를 들어 나이가 계속되면이 문제에 접근 할 수있는 다른 방법이있을 수 있지만 OP가 제시 한 예는 아닙니다.


두 가지 교차 요인의 구조를 사용하지 않습니다. 네 그룹 만 비교하면됩니다. 던의 시험은 전혀 상호 작용에 관한 것이 아닙니다.
Horst Grünbusch

동의 Dunn의 테스트는 상호 작용에 관한 것이 아닙니다. 그러나 질문은 두 이진 변수 간의 상호 작용에 대해 구체적으로 묻습니다. 내 대답은 이것이 네 그룹을 비교하는 것과 어떻게 동등한 지 보여줍니다. 상호 작용 용어가 OP에 익숙하지 않다면 이것이 유용한 예일 것입니다.
5ayat

1

따라서 다음과 같은 임의 변수가 있습니다.

  • 에스{남성,여자}
  • ]0,[

그리고 다음과 같은 확률 질량 / 밀도 함수가 있습니다.

  • 에프
  • 에프,,
  • 에프,에스,에스
  • 에프,,에스,,에스

에스

  • 에프,(,)에프()
  • 에프,에스(,에스)에프()

에프,,에스(,,에스)에프,(,)에프,에스(,에스)

체중 가 있음을 보여 주면에스

그러나 위의 실제 공동 PDF를 모릅니다. 비모수 적 방법으로 자신을 제한하고자하므로 이제는 다음과 같은 비모수 적 추정값을 찾아야합니다.

  • 에프^,(,)
  • 에프^,에스(,에스)
  • 에프^,,에스(,,에스)

그리고 그것을 보여주십시오 :

  • 밀도 추정치는 충분히 정확합니다.
  • 에프^,,에스(,,에스)에프^,(,)에프^,에스(,에스)
  • 에프^,,에스(,,에스)=에프^,(,)=에프^,에스(,에스) 매우 낮다.

0

상호 작용 효과를 확인 하는 것 입니다. 선형 모델링은 그러한 것을 확인할 수는 있지만 매개 변수가 아니므로 다른 도구를 사용해야한다고 생각합니다.

당신은 어떻게 확인 agegender지금까지 효과 하고 있습니까?

편집 : 이 답변 은 도움이 될 것 같습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.