변경 점수에 대한 독립 변수의 효과를 테스트 할 때 기준 측정 값을 제어 변수로 포함하는 것이 유효합니까?


38

OLS 회귀를 실행하려고합니다.

  • DV : 1 년에 걸친 체중 변화 (초기 체중-최종 체중)

  • IV : 운동 여부.

그러나 무거운 사람이 얇은 사람보다 운동 단위당 더 많은 체중을 잃는 것이 합리적입니다. 따라서 제어 변수를 포함하고 싶었습니다.

  • CV : 초기 시작 무게.

그러나 이제 초기 가중치 를 사용하여 종속 변수 AND를 제어 변수로 계산합니다.

괜찮습니까? 이것이 OLS의 가정을 위반합니까?


4
치료가 무작위로 할당 되었습니까?
Andy W

1
최근에 stats.stackexchange.com/q/15104/1036이라는 매우 유사한 다른 질문이 있었습니다 . 해당 질문에 대한 답변이이 질문에 적용됩니다 (사실 중복 질문이라고합니다).
Andy W

3
@Andy 사실, 두 질문은 다른 질문보다 다른 질문에 대답 할만큼 충분히 다릅니다. 찰리는 이미 여기서 좋은 분석을했습니다.
whuber

3
차이 점수를 사용하는 것은 일반적으로 신뢰성의 실질적인 감소와 관련이 있지만, 이는 다소 논쟁의 여지가 있습니다.
Behacad

답변:


25

"변경 점수에 대한 독립 변수의 영향을 테스트 할 때 기준 측정 값을 제어 변수로 포함하는 것이 유효합니까?"라는 실제 질문에 대답하려면 대답은 ' 아니요' 입니다. 하여 때문에 답이 아니요 구조 변화 점을 종속 변수로서 사용될 때 기준 점수 해석 불가능한되는 변화 점에서, 에러 항과 기준선 따라서 예상 효과 상관된다.

사용

  • Y1초기 무게로
  • Y2최종 무게로
  • Δ Y = Y 2Y 1ΔY 중량 변화로서 (즉 )ΔY=Y2Y1
  • T무작위 배정 된 치료 로서의 , 및
  • X 는 체중에 영향을 미치는 다른 외인성 인자 (예 : 결과와 관련이 있지만 무작위 배정으로 인해 치료와 관련이없는 기타 제어 변수)

그런 다음 와 에 대해 를 회귀하는 모델이 있습니다 . T XΔYTX

ΔY=β1T+β2X+e

정의에 따라 다음과 같습니다.

Y2Y1=β1T+β2X+e

이제 기준선을 공변량으로 포함 하면 방정식의 양변에 항이 있다는 문제가 있습니다 . 이는 이 본질적으로 오류 용어와 관련되어 있기 때문에 해석 할 수 나타냅니다 .β 3 Y 1Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

이제 다양한 답변에서 혼란의 일부는 다른 모델이에 대한 동일한 결과를 얻을 것이라는 사실에서 줄기 것 같다 치료 효과 , 내 위의 공식에서. 따라서 변화 수준을 종속 변수로 사용하는 모델의 처리 효과를 "수준"을 사용하는 모델 ( 공변량으로 기준선 을 포함하는 모델)을 사용하는 모델에 대한 처리 효과를 비교한다면 처리 효과에 대한 해석은 같은. 따라 두 모델에서 추론이 그들을 기반으로합니다 그래서 동일합니다, 그리고 (브루스 위버 일부가 SPSS 코드가 아니라 동등성을 입증 게시).Y 1 β 1 Tβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

그래서 일부는 논쟁 할 것입니다 ( Felix는 이 글에서, Bruce Weaver는 SPSS google 그룹 에 대해 논의했습니다) 모델이 동일한 추정 처리 효과를 나타내므로 어느 것을 선택하든 문제가되지 않습니다. 동의하지 않습니다. 변경 점수 모델의 기준선 공변량을 해석 할 수 없으므로 (추정 된 치료 효과가 동일한 지 여부에 관계없이) 기준선을 공변량으로 포함해서는 안됩니다. 변화 점수를 종속 변수로 사용하는 점은 무엇입니까? Felix가 이미 언급했듯이 공변량으로 기준선을 제외한 종속 변수로 변경 점수를 사용하는 모델은 수준을 사용하는 모델과 다릅니다. 명확히하기 위해, 후속 모델은 상이한 치료 효과를 제공 할 것이다 (특히 치료가 기준선과 상관되는 경우).

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

이것은 선행 문헌에서 "주님의 역설"로 언급되었습니다. 어떤 모델이 맞습니까? 무작위 실험의 경우, Levels 모델이 바람직하다고 말할 것입니다 (좋은 직업 무작위 화를 수행하더라도 평균 치료 효과는 모델간에 매우 가까워 야합니다). 다른 사람들은 레벨 모델이 바람직한 이유에 대해 언급했습니다. Charlie의 답변 은 레벨 모델에서 기준선과의 상호 작용 효과를 추정 할 수 있지만 변경 점수 모델에서는 불가능하다는 점에서 좋은 지적입니다. 매우 유사한 질문에 대한 이 응답 에서 Whuber 는 변화 점수가 어떻게 다른 치료들 사이의 상관 관계를 유도하는지 보여줍니다.

치료가 무작위로 할당되지 않은 상황에서 변화 점수를 종속 변수로 사용하는 모델에 더 많은 고려가 필요합니다. 변경 점수 모델의 주요 이점은 결과의 불변 예측 변수가 항상 제어된다는 것입니다. 따라서 위의 공식에서 는 시간이 지남에 따라 일정하며 (예를 들어, 유전 적 소인이 특정 무게를 가짐), 는 개인이 운동을 선택했는지 여부와 상관이 있습니다 ( 는 관찰되지 않음). 이 경우, 변경 점수 모델이 바람직하다. 치료로의 선택이 기준치와 상관되는 경우에도, 변화 점수 모델이 바람직 할 수있다. 폴 앨리슨은 그의 논문에서X XXXX회귀 분석에서 종속 변수로 점수 변경 은 동일한 예제를 제공합니다 (주제에 대한 나의 관점에 크게 영향을 미쳤으므로이를 읽어 보는 것이 좋습니다).

이것은 무작위 화되지 않은 설정에서 변경 점수가 항상 선호된다는 것은 아닙니다. 기준선이 사후 가중치에 실제로 인과 적 영향을 미칠 것으로 예상되는 경우 레벨 모델을 사용해야합니다. 기준선에 인과 관계 효과가 있고 치료 선택이 기준선과 상관되는 경우 치료 효과는 기준선 효과와 혼동됩니다.

Charlie의 가중치 로그가 종속 변수로 사용될 수 있다는 점을 무시했습니다. 이것이 가능한지 의심 스럽지만 초기 질문에는 다소 비판적 입니다. 변수의 로그를 사용하는 것이 적절할 때 (그리고이 경우에도 여전히 적용되는) 또 다른 질문 이 논의되었습니다. 기록 된 체중을 사용하는 것이 적절한 지 여부를 안내하는 데 도움이되는 이전 문헌이있을 수 있습니다.


소환

Allison, Paul D. 1990. 회귀 분석에서 점수를 종속 변수로 변경합니다 . 사회 방법론 20 : 93-114. 공개 PDF 버전 .


3
Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)공변량으로서 없이 공동으로 . 이 점에서 데이터가 누락되지 않고이 접근법은 Y 1 이 고정 공변량 인 것과 동일하다는 것을 알게되었습니다 (나는 이것에 대한 몇 가지 참조를 시도 할 것입니다). Y1Y1
dandar

1
Y1Y1Y2Y1Y2

1
Y1β1

1
B1

1
응답으로서의 측정, 및 고정 기준값에 대한 컨디셔닝, 및 둘째, ANCOVA 모델로부터의 포인트 추정 편차가 무조건적인 것보다 크거나 같다는 점. 이 차이는 그룹 간의 기본 평균 반응이 작다는 것을 보장하는 무작위 배정으로 인해 일반적으로 작습니다. 저자는 무조건 모델이 기준선을 임의 변수로 모델링하는 데 적합하지만 ANCOVA를 고정 된 것으로 볼 때 적절하다고 결론 내 렸습니다.
dandar

21

앤디의 대답은 경제학자의 견해 인 것 같습니다. 임상 시험에서 거의 항상 반응 변수의 기본 버전을 조정하여 힘을 크게 증가시키는 것이 허용됩니다. 기준 변수를 조건으로하므로 전체 오류 항과 혼동 될 수있는 '오류 항'이 없습니다. 기본 공변량의 측정 오류가 다른 X와 혼동되어 다른 X의 효과가 왜곡되는 경우 유일한 문제가됩니다. 전체적으로 선호되는 방법은 기준을 조정하고 변경을 계산하지 않고 응답 변수를 모델링하는 것입니다. 이에 대한 한 가지 이유는 변경이 Y의 변환을 얻는 데 크게 의존하고 변경이 일반적으로 회귀 모형에 적용되지 않기 때문입니다. 예를 들어 Y가 서수 인 경우 두 서수 변수의 차이는 더 이상 서 수가 아닙니다.


1
이 답변을 완전히 이해하지 못합니다. "기준선 조정"은 무엇을 의미합니까? 차이를 가져 오거나 통제 할 수 있습니까?
Henrik

3
'기준선 조정'이란 기준선을 공변량으로 포함시키는 것을 의미했습니다. 변경 점수를 사용하는 것도 일반적이지만 공변량으로 기준선을 조정하지 않고는 변경할 수 없습니다 (따라서 변경 점수에 신경 쓰이는 이유는 무엇입니까?).
Frank Harrell

6
실제로 당신이 여기서 말하는 (또는 Felix의 의견에 대한 답변으로) 당신이 말하는 것과 직접적으로 상충되는 것은 없습니다. 변화 점수를 사용하는 것은 '기준선에 대한 조정'이 아니며, 불변의 생략 된 변수에 대해 제어합니다 (또는 치료 선택이 기준선과 높은 상관 관계가있는 경우). 기준선이 양립 할 수없는 경우 (즉, 결과에 직접적인 원인이 있거나 치료와 상호 작용하는 경우) 변경 점수는 문제를 해결하지 못합니다.
Andy W

2
@Frank Harrell이 토론에 참여하고 이것을 명확히 해주셔서 감사합니다. (+1)
Henrik

8

우리는 @ocram의 추론을 약간 변경하여 를 가질 수있다

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

xw0w0

이 설정은 시작 무게 가 치료영향이 아니라 무게 의 차이 를 예측한다는 것을 의미합니다 . 이것은 아마도 상호 작용 항, 아마도 요구할 것이다

E[w1w0X,w0]=β0+(xw0)β+w0γ.

log(w1)log(w0)r;
rx이 예측 변수가 체중의 비례 변화와 어떤 관련이 있는지 알려줄 것입니다. 예를 들어, 130 파운드의 몸무게를 가진 사람을 위해 몸무게를 10 % (0.1의 계수에 100 %를 곱한) 줄이는 운동 체제는 몸무게를 13 파운드 씩 줄이면서 초기 체중을 "제어"합니다. 200 파운드 참가자의 무게는 20 파운드입니다. 이 경우 오른쪽에 초기 무게 (또는 로그)를 포함하지 않아도됩니다.

w0w0β1β1

log(w0)β1/w0

보시다시피, 상호 작용 항에 대한 교차 부분은 해석하기가 약간 까다로울 수 있지만 관심있는 영향을 줄 수 있습니다.


안녕 찰리, 나는 비율 변화를 사용하는 이점을 보았습니다. 그러나 왜 w1을 w0로 나누는 것과 달리 기록 된 변수의 차이를 찾으십니까?
ChrisStata

비례 변화라는 아이디어가 마음에 듭니다. 그러나 예상되는 상호 작용이 문자 그대로 비례하는지 아닌지에 대한 의문은 여전히 ​​남아 있습니다. 그렇지 않은 경우에도 초기 무게를 공변량으로 포함시켜야합니다. 또는 100 또는 200 파운드의 사람을 위해 체중의 10 %를 잃는 것이 똑같은 어려움이 아니라고 확신하십니까?
Henrik

@ChrisStata, 당신도 그렇게 할 수 있습니다. 나는 경제학자이고 우리는 우리의 통나무를 좋아합니다 (그리고 차이점도). 각 사람에 대해 시계열 (예 : 다중 관측치)이있는 경우 (패널 데이터 세트 만들기) 내 방식이 더 낫다고 주장 할 수 있지만 여기서는 관련이 없습니다. 헨릭, 당신 말이 맞아요. 나는 그것에 대해 조금 대답했다.
찰리

8

편집 : Andy W의 주장은 Model C를 떨어 뜨릴 것을 확신했습니다. 다른 가능성을 추가했습니다 : 임의 계수 모델 (일명 다중 레벨 모델 또는 혼합 효과 모델)을 사용한 변경 분석

차이 점수 사용에 대한 많은 과학적 논쟁이있었습니다. 내가 가장 좋아하는 글은 Rogosa (1982, [1])와 Fitzmaurice, Laird, & Ware (2004, [2])입니다.

일반적으로 데이터 분석에는 세 가지 가능성이 있습니다.

  • A) 개인간 차이 점수 (변경 점수) 만 가져 가십시오.
  • B) 포스트 측정을 DV로 취급하고 기준선에 대해 제어
  • C) 차이 점수를 DV로하여 기준선 (제안한 모델)에 대해 제어합니다. Andy W의 주장으로이 대안을 삭제했습니다
  • D) 다단계 / 혼합 효과 모델 접근법을 사용하여 회귀선이 각 참가자에 대해 모델링되고 참가자가 레벨 -2 단위로 처리됩니다.

모델 A 및 B는 기준선이 변화 점수와 상관 관계가 있거나 (예를 들어, 더 많은 사람들이 더 많은 체중 감소를 가짐) 치료 과제가 기준선과 상관 관계가있는 경우 매우 다른 결과를 생성 할 수 있습니다.

이러한 문제에 대한 자세한 내용은 인용 된 논문 또는 여기여기를 참조하십시오 .

A 또는 B가 선호되는 조건을 실험적으로 비교 한 최근의 시뮬레이션 연구 [3]도있다.

결 측값이없는 완전 균형 설계의 경우, 모델 D는 모델 A와 동일해야합니다. 그러나 사람 변동성에 대한 자세한 정보를 제공하고 더 많은 측정 지점으로 쉽게 확장되며 불균형 데이터가있는 경우 우수한 특성을 갖습니다. 및 / 또는 결 측값.

결론적으로 : 귀하의 경우 기준 (모델 B)에 대해 제어 된 사후 측정을 분석합니다.

[1] Rogosa, D., Brandt, D., & Zimowski, M. (1982). 변화 측정에 대한 성장 곡선 접근법. 심리 게시판, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM, & Ware, JH (2004). 적용된 종 방향 분석. 뉴저지 호보 켄 : 와일리.

[3] Petscher, Y. 및 Schatschneider, C., 2011. 무작위 실험 설계에서 단순 차이 및 공분산 조정 점수의 성능에 대한 시뮬레이션 연구. 교육 측정 저널, 48, 31-43.


이 답변을 하향 조정했으며 공변량으로 기준선을 사용하여 변경 점수가 수행되지 않아야한다고 생각하는 이유에 대한 내 답변을 볼 수 있습니다. 요약하자면, 제제에서 모델 B와 C가 동등한 처리 효과를 생성하더라도 모델 C가 바람직하다는 의미는 아닙니다. 실제로 모델 C의 기준 효과는 해석 할 수 없으므로 사용해서는 안된다고 주장합니다.
Andy W

@AndyW : 당신의 주장은 저를 설득했습니다; 치료 효과의 가장 관련성있는 추정치가 두 모델에서 동일하지만 모델 B보다 모델 B를 선호해야합니다. 이에 따라 대답을 조정했습니다. 그러나 Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.B와 C의 동등성을 보여주는 누가?
Felix S

b¯b¯

모델 D의 한 가지 점입니다. 모델 D 만 고려하지 않는 이유가 궁금합니다. 가장 일관성이 있습니다 (기준값은 임의 변수이며 종속 변수로 강제하지 않습니다). 간단하고 매우 유연합니다 (상호 작용 추가) 인구의 표준 편차를 제공합니다.
giordano


3

Glymour et al. (2005)는 변경 점수를 분석 할 때 기준선 조정을 사용하여 해결했습니다. 건강 상태의 변화가 기준선 평가보다 우선하거나 종속 변수에 측정 오차가 큰 경우, 종속 변수에 기준 공변량이 포함되어 있으므로 변경 점수를 사용하는 회귀 모델이 바이어스가 발생할 수 있습니다. Frank Harrell의 답변 "기본 공변량의 측정 오류가 다른 X와 혼동되어 다른 X의 효과가 왜곡되는 경우 유일한 문제가 될 것입니다." Glymour 주소와 동일한 바이어스를 반영 할 수 있습니다.

Glymour (2005) "기준 분석이 언제 변경 분석에 유용한가? 교육 및인지 적 변화의 예. American Journal of Epidemiology 162 : 267-278


1

오크 람이 올바르지 않습니다. 무게 차이 는 초기 무게를 고려 하지 않습니다 . 구체적으로, 초기 중량은 최종 중량을 빼서 제거된다.

따라서 초기 무게를 제어하면 가정을 위반하지 않는다고 주장합니다.

BMI와 초기 BMI의 차이를 고려할 때 동일한 논리가 적용됩니다.



Andy W의 비평가가 업데이트 된 후에 내가 왜 옳고 Ocram이 잘못되었는지에 대해 좀 더 공식적으로 설명하도록하겠습니다 (적어도 제 시점에서).

aw
iw=awew=aw+Δw

Δw=iwew=awaw+Δw=Δw

aw

이를 고려하려면 모델을 모델에 개별적으로 통합해야합니다 (일반 매개 변수 및 / 또는 상호 작용 항으로).

ΔBMJew=awpropΔw


차이가 초기 무게를 고려한다고 말했을 때, 이것이 실제로 의미하는 것입니다. 이제 구체적으로 무엇을 쓰시겠습니까? 최종 무게-초기 무게 = ...?
ocram

내가 쓴 것처럼, 당신의 주장은 나에게 거짓 인 것 같습니다. I는 동일한 "크기"에 그대로 diffeence이 때문에 일부 최종 중량으로 ( "재 스케일링"되는 반면, 사실 최종 중량이 고려 이상의 초기 중량 걸리는 주장 절대 값 anoher로부터 감산 absoulte 값.
Henrik

(-1) 이것은 정확하지 않습니다. 일반적으로 방정식의 오른쪽과 왼쪽 모두에 동일한 변수를 포함하면 안됩니다 (독립 변수가 오류 항과 상관 관계가 있기 때문에). 따라서 종속 변수에 차이를 사용하는 경우 기준선을 공변량으로 포함해서는 안됩니다.
Andy W

@ 앤디 W : 나는 당신의 주장이 정확하다는 것을 알고 있습니다. 그러나 내 주장은 당신이 절대 값을 부분적으로 (기준 값으로 te end 값을 빼서) 부분적으로 제거 함으로써이 상관 관계를 제거한다는 것입니다. 따라서 공변량으로 추가한다고해서 그런 종류의 가짜 오류 상관 관계가 나타나지는 않습니다.
Henrik

@Henrik,이 질문에 대한 나의 답변과 왜 아직도이 정서가 잘못 인도되었다고 생각하는지보십시오.
Andy W

0

그것을 관찰하십시오

end weightinitial weightY=β0+βTx

에 해당

end weight=initial weight+β0+βTx

즉, DV로 무게 변화 (종료 무게 대신)를 사용하는 것은 이미 초기 무게를 설명합니다.


1
그러나 훈련을 받으면 초기 체중과 체중 감량 사이에 상호 작용이있을 수 있습니다. 신장 1,90m, 몸무게 70kg의 성인과 신장 1,60m, 몸무게 90kg의 성인이 동일한 훈련에 참여한다고 가정 해 봅시다. 나는 후자가 더 많은 체중을 잃을 것이라고 확신합니다. 다시 생각해 보면, 체질량 지수는 체중보다 나은 CV 일 것입니다.
xmjx

1
@xmjx : 초기 무게가 최종 무게에 영향을 줄 것이라고 생각한다면-아마도 당신이 옳을 것입니다-여기에서 수행되는 것처럼 모델에서 오프셋으로 소개하는 것이 좋습니다 ...
ocram

3
일반적으로 정확하지 않습니다. 베이스 라인 가중치의 기울기가 1.0이 아닌 경우 초기 가중치가 두 모델에 있고 일반 회귀를 사용하지 않는 한 변경 분석은 최종 가중치 분석과 동일하지 않습니다. 기준선 가중치가 두 군데에있는 경우 모형을 실제로 설명하기가 더 어려우므로이 접근 방식을 유지하는 이유는 명확하지 않습니다.
Frank Harrell
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.