설명 변수 중 하나에 2 차 및 3 차 항이있을 때 설명 변수 간의 상호 작용을 어떻게 모델링해야합니까?


10

본인은이 질문에 명확하게 답변 할 수있는 방식으로이 질문에 대한 답변을 드리겠습니다. 그렇지 않은 경우 알려 주시면 다시 시도하겠습니다! 또한 이러한 분석에 R을 사용할 것입니다.

나는 여러 조치가 plant performance (Ys)나는 imposed-- 네 치료에 의해 영향을받은 것으로 의심을 flower thinning (X1), fertilization (X2), leaf clipping (X3)하고 biased flower thinning (X4). 가능한 모든 Y에 대해 N은 242 이상이므로 샘플 크기가 큽니다. 모든 플롯은 얇아 ​​지든 아니든, 각각의 플롯은 다른 3 가지 처리 중 하나 (그리고 하나만)에 적용되었습니다 (또는 제어 플롯도 없었습니다). 이 디자인의 아이디어는 다른 세 가지 처리가 희석 효과를 "마스킹"또는 "강화"할 수 있는지 테스트하는 것이 었습니다. 따라서 설계 상 후자의 세 가지 치료 (X2-X4)는 교차하지 않았기 때문에 서로 상호 작용할 없었지만 각각 꽃이 얇아지는 것과 상호 작용할 수 있습니다 .

나의 명백한 가설은 1) 개화 숱이 중요하고 2) X1*X2, X1*X3, and X1*X4,꽃 숱과 다른 3 가지 치료 사이 의 상호 작용 항 또한 중요하다는 것입니다. 즉, 꽃 가늘게하는 것이 중요해야하지만 중요한 세 가지 치료법에 따라 중요한 방법이 크게 바뀌어야합니다.

이 모든 정보를 혼합 모델에 포함하고 싶습니다.

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

그러나 한 가지 끊기가 있습니다. Y에 대한 희석 효과가 비선형이라고 믿을만한 충분한 이유가 있습니다. 그것들은 아마도 이차적이지만 어떤 경우에는 입방체 일 수도 있습니다. 성능에 대한 희석 효과가 더 높은 수준의 희석 효과에서 더 빠르게 증가 할 수 있기 때문입니다. X1에 2 차 및 3 차 항을 추가하여 위의 방정식을 통해이 비선형 관계를 모델링하려고하면 상호 작용 항을 모델링하는 방법을 확신 할 수 없습니다. 가능한 모든 X1 조합을 포함해야합니다. 2, (X1) ^ 3 * X2, X3 및 X4? 그것은 내가 가지고있는 데이터 포인트의 수에 관계없이 추정하려고 많은 매개 변수처럼 보이기 때문에 얻을 결과를 해석하는 방법을 잘 모르겠습니다. 즉, 이것이 상황을 모델링하는 데 부적절한 방법이라고 생각할 생물학적 이유는 없습니다.

따라서이 문제를 해결하는 방법에 대한 세 가지 생각이 있습니다.

  1. 예를 들어 Y ~ X1 + X1^2 + X^3 + Random effects, 씨닝과 Y 사이의 관계가 선형, 2 차 또는 3 차 관계인지 파악하려는 유일한 목적으로 더 작은 모델을 먼저 적합시킨 다음, 제곱근 또는 제곱근을 통해 희석을 변환하여 관계를 적절하게 선형화하십시오. 여기에서 상호 작용 항은 변환 된 변수를 사용하여 위와 같이 모델링 될 수 있습니다.
  2. 중요한 상호 작용이 발생하는 경우 X1 항 중 하나 (즉, 선형, 2 차 또는 3 차 항)에만 영향을주고 그에 따라 상호 작용을 모델링한다고 가정하십시오. 이 접근법이 의미가 있는지조차 확실하지 않습니다.
  3. 위에서 설명한 것처럼 희석 용어와 다른 처리 사이의 가능한 모든 상호 작용 항에 "전체 모델"을 맞추십시오. 그런 다음 중요하지 않은 상호 작용 항을 정리하고 그래프 및 기타 기술을 사용하여 결과를 해석하십시오.

모델 선택이 아닌 가설 검정에 관심이 있다는 점을 고려할 때 이러한 접근 방식 중 가장 적합한 방법은 무엇입니까? 특히, 위의 1 번 경우 하지 않습니다 이해 할 수 있도록, 그 이유는? 나는 읽고 이 문서이 문서를 나를 위해 그들의 뜻을 모른 무슨 소화하려고 노력하지만, 추가 읽기를위한 어떤 소스도 많이 주시면 감사하겠습니다!

답변:


7

이러한 접근 방식 중 어느 것도 제대로 작동하지 않습니다. 접근법 3이 가까워졌지만 중요하지 않은 용어를 제거 할 것이라고 말했습니다. 공선 성으로 인해 제거 할 항을 찾을 수 없기 때문에 문제가되며, 제 1 종 오류를 유지하려는 경우 가설 검정에서 잘못된 자유도를 제공하기 때문에 문제가됩니다.

효과적인 표본 크기와 신호에 따라 문제의 노이즈 비율 : 모든 제품 및 주 효과 항에 모형을 적합시키고 도표와 "청크 테스트"(관련 용어에 대한 다중 df 검정, 즉 전체 상호 작용에 대한 테스트, 비선형 상호 작용에 대한 테스트, 주요 효과 + 상호 작용 등 전체 효과에 대한 테스트 등) R rms패키지를 사용하면 가 다변량 법선 인 표준 일 변량 모델 및 종 방향 모델에 대해이 작업을 쉽게 수행 할 수 있습니다 . 예:Y

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

당신이 볼 때 anova표를 당신은 표시 줄 볼 수 있습니다 All Interactions전체 모델의 결합 된 영향 테스트 의 모든 상호 작용 조건을. 개별 예측 변수의 경우 예측 변수가 둘 이상의 변수와 상호 작용할 때만 유용합니다. 이 print방법 anova.rms에는 테이블에서 각 행을 표시하여 0에 대해 테스트중인 매개 변수를 정확하게 표시 하는 옵션이 있습니다 . 이 모든 것은 범주 형 예측 변수와 연속 형 예측 변수의 혼합으로 작동합니다.

일반 다항식을 사용하려면 pol대신을 사용하십시오 rcs.

불행히도 혼합 효과 모델을 구현하지 않았습니다.


1
이 답변에 감사드립니다. 스플라인을 사용한 적이 없지만 귀하의 모범을 이해한다고 생각합니다. 괜찮다면 후속 질문이 몇 개 있습니까? 1. 예에서와 같이 ols의 anova 결과를 볼 때 요인 아래의 "모든 상호 작용"이란 무엇입니까? 즉, 무엇과의 모든 상호 작용? 2. 혼합 모델링 접근법에서 유사한 접근법이 허용됩니까? 나는 임의의 요소가 필요하다고 생각합니다. 예를 들어 lme4와 호환됩니까? 3. 상호 작용하는 치료 중 일부가 범주 형인 경우이 방법이 효과가 있습니까? 예를 들어 X2가 2 단계 요인이라면 어떻게 될까요?
Bajcz

2

나는 비모수 적 평활 회귀 분석을 사용하여 종속 변수와 예측 변수 사이의 관계 함수 형태를 평가하는 팬입니다. 비선형 관계를 자주 찾았지만 주요 효과가 비선형 인 경우에도 비선형 상호 작용 상호 작용 항을 찾지 못했습니다. 나의 집으로 가기 : 상호 작용 효과는 그것들이 구성되는 예측 자와 동일한 기능적 형태로 구성 될 필요는 없다.


명확하게 말하면, 옵션 # 2를 선택하면 선형 X1 항에 상호 작용 항을 안전하게 포함시킬 수 있으며 "고차 상호 작용 항 (예 : X1 ^ 2 * X3 등)"에 대해 걱정하지 않아도됩니다.
Bajcz

1
내가 선형 전용의 상호 작용으로 발생한 데이터 세트에서 내가 얻는 것을 처리했다 (1)에 의해, 또한 내가 좋아 (2) : @Bajcz 음 ... 나는 두 가지를 말하고 생각 모습을 (비모수 회귀 분석을 사용) 비선형 대안을 고려해야하는지의 여부를 데이터가 알려주도록합니다. [비선형 항에 대한 모형 적합 또는 가설 검정 접근법을 취하는 것은 IMO가 그것을 다루는 잘못된 방법입니다.
Alexis

3
상호 작용이 선형 일 가능성이 높다고 믿을만한 큰 이유는 없습니다. 비선형 상호 작용의 훌륭한 예를 보았습니다. "보고"및 "데이터를 알려주는 것"이라는 아이디어는 잘못된 신뢰 구간 적용 범위 문제를 포함한 추론 문제로 인해 어려움을 겪고 있습니다.
Frank Harrell

1
@FrankHarrell 감사합니다! 첫 번째 문장은 위의 의견에서 내 (2)에서 극복하려고 한 요점입니다 (과거의 과거 경험은 미래에 크게 다를 수 있습니다). OTOH : 데이터를 말하지 못하게하는 것은 모델링 가정의 인공물에 대한 추론을 실제 데이터에 대한 추론에 전가시키는 훌륭한 전략입니다.
Alexis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.