통제와 치료의 차이를 명시 적 또는 암시 적으로 모델링해야합니까?


9

다음과 같은 실험 설정이 제공됩니다.

피험자로부터 여러 샘플을 채취하고 각 샘플을 여러 방법으로 처리합니다 (대조 치료 포함). 가장 흥미로운 점은 대조군과 각 치료법의 차이입니다.

이 데이터에 대한 두 가지 간단한 모델을 생각할 수 있습니다. 샘플 , 처리 , 처리 0이 제어 인 경우 데이터로, 를 샘플 의 기준선으로 , 를 처리 의 차이로 설정하십시오 . 첫 번째 모델은 제어와 차이점을 모두 살펴 봅니다.ijYijγiiδjj

Yij=γi+δj+ϵij
δ0=0

두 번째 모델은 차이점 만 살펴 봅니다. 만약 우리가 미리 계산 사전에 다음 dij

dij=YijYi0
dij=δj+εij

내 질문은이 두 설정의 근본적인 차이점은 무엇입니까? 특히, 레벨 자체가 의미가없고 차이 만 중요한 경우, 첫 번째 모델이 너무 많은 작업을 수행하고 있고 아마도 힘이 부족합니까?


2
나중에 더 철저하게 대답 할 수는 있지만 폴 앨리슨 (Paul Allison)의이 논문이 흥미로울 것이라고 제안한다 ( Allison, 1990 ).
Andy W

1
다른 모델의 오류가 실제로 동일하지 않다는 사실을 반영하여 편집되었으므로 동일한 기호를 사용해서는 안됩니다.
Rónán Daly

답변:


6

가능성이 두 번째 모델에 상관 관계가 아니라 첫 번째 수 있습니다.ϵij

첫 번째로,이 용어는 측정 오차와 가산 모델의 편차를 나타냅니다. 측정 순서를 무작위 화하는 등 합리적인주의를 기울이면 모델이 정확할 때 이러한 오류를 독립적으로 만들 수 있습니다. 어떻게

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

(주이 모순 질문의 마지막 방정식이 가정하는 잘못 때문 . 것을 인정하는 우리를 강제 그렇게 확률 변수가 아닌 매개 변수는이, 적어도 우리가 인정되면 제어에 대한 측정 오류 가능성 아래 동일한 결론으로 ​​이어질 것입니다.)ϵi0=0γi

들면 , 이 의미j,k0jk

Cov(dij,dik)=Cov(ϵijϵi0,ϵikϵi0)=Var(ϵi0)0.

상관 관계는 상당 할 수 있습니다. iid 오류의 경우 유사한 계산에서 0.5와 같습니다. 이 상관 관계를 명시적이고 정확하게 처리하는 절차를 사용하지 않는 한 두 번째 모델보다 첫 번째 모델을 선호하십시오.


따라서 첫 번째 모델이 실제 모델이고 두 번째 모델의 바람직하지 않은 속성을 도출했다고 가정했습니다. 모든 모델이 잘못되었다는 것을 알고 있으므로이 결과가 실제로 의미가 있습니까?
Macro

1
@ 매크로 내 답변을보다 자세히 읽으십시오. 첫 번째 모델을 정당화하고 두 번째 모델과 구별하기 위해 어떤 가정이 필요한지 보여 주도록 만들어졌지만 어떤 모델이 "참"이라는 가정은 포함되어 있지 않습니다. 예를 들어, "모델이 정확할 때"주의 사항에 유의하십시오. "정확한"이라는 단어조차도 "진정한"모델 또는 "올바른"모델이 있다는 잘못된 인상을 피하기위한 생각으로 선택되었습니다.
whuber

1
조금 혼란 스럽습니다. 무엇입니까? dik
Andy W

1
@Andy 와 두 가지 별개의 처리를 색인합니다. "For ..."이라고 써야합니다 .; 나는 그 오타를 고칠 것이다. 찾아 주셔서 감사합니다. jkj,k0
whuber

@whuber 귀하의 진술을 뒷받침하는 참조 자료가 있습니까 (예 : 리뷰어를 설득하기 위해)?
Daniel
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.