귀하의 질문 (의견에 대한 추가 논평)은 연구원이 일부 무작위 설계에 따라 설명 변수 중 하나 이상을 무작위로 할당하는 무작위 통제 시험이있는 경우에 주로 관심이있는 것으로 보입니다. 이러한 맥락에서 설명 변수를 무작위 화에 의해 부과 된 샘플링 분포에서 무작위 변수로 취급하지 않고 설명 변수를 알려진 상수로 처리하는 모델을 사용하는 이유를 알고 싶습니다. (귀하의 질문은 이것보다 광범위하지만 이것은 해설에 대한 주요 관심사 인 것처럼 보이므로 이것이 내가 다룰 것입니다.)
우리가 설명 변수를 조건화하는 이유는 RCT에 대한 회귀 문제 에서 예측 변수가 주어진 응답 변수 의 조건부 분포 에 여전히 관심이 있기 때문 입니다. 실제로, RCT에서 우리는 설명 변수 가 반응 변수 에 미치는 원 인적 영향 을 결정하는 데 관심이 있으며 , 이는 조건부 분포에 대한 추론을 통해 결정할 것입니다 (혼동을 막기 위해 일부 프로토콜에 따라). 무작위 화는 설명 변수 와 혼동되는 변수 사이의 의존성을 깨뜨리기 위해 부과됩니다 (즉, 백도어 연관 방지). XYX†† 그러나 문제의 추론의 대상은 여전히 설명 변수가 주어지면 응답 변수 의 조건부 분포 입니다. 따라서, 아직 추론에 대한 좋은 특성이 추정 방법 사용이 조건부 분포의 매개 변수를 추정하는 것이 합리적 조건부 분포를 .
이것이 회귀 기술을 사용하여 RCT에 적용되는 일반적인 경우입니다. 물론, 우리가 다른 관심사를 가지고있는 상황이 있으며, 실제로 설명 변수에 대한 불확실성을 통합하고 싶을 수도 있습니다. 설명 변수에 불확실성을 포함시키는 것은 일반적으로 두 가지 경우에 발생합니다.
(1) 회귀 분석을 넘어서 다변량 분석으로 넘어갈 때 우리 는 전자에 주어진 후자의 조건부 분포보다는 설명 및 반응 변수 의 공동 분포에 관심이 있습니다. 이것이 우리의 관심사 인 응용 프로그램이있을 수 있으므로 회귀 분석을 넘어 설명 변수의 분포에 대한 정보를 통합합니다.
(2) 일부 회귀 응용에서 우리의 관심은 관찰되지 않은 설명 변수에 조건부 응답 변수의 조건부 분포에 있으며, 여기서 우리는 관찰 된 설명 변수에 오류가 있다고 가정합니다 ( "변수 오류"). 이 경우 우리는 "변수 오류"를 통해 불확실성을 통합합니다. 그 이유는 이러한 경우에 대한 우리의 관심 은 관찰되지 않은 기본 변수에 조건부 인 조건부 분포에 있기 때문입니다 .
두 경우 모두 회귀 분석보다 수학적으로 더 복잡하므로 회귀 분석을 사용하여 벗어날 수 있다면 일반적으로 바람직합니다. 어쨌든 대부분의 회귀 분석 적용에서 목표는 관찰 가능한 설명 변수가 주어지면 반응의 조건부 분포에 대해 추론하는 것이므로 이러한 일반화는 필요하지 않습니다.
† 무작위 화는 원인 변수를 혼란 변수에서 무작위 변수로 분리하지만, 무작위 변수에서 혼란 변수로의 원인 반응을 분리하지는 않습니다. 이는 인과 분석에서 모든 백도어 연관을 완전히 분리하기 위해 다른 프로토콜 (예 : 위약, 눈가림 등)이 필요할 수 있음을 의미합니다.