무작위 할당 : 왜 귀찮게?


9

무작위 배정은 잠재적 결과로부터 치료의 독립성을 보장하기 때문에 가치가 있습니다. 그것이 평균 치료 효과의 편견없는 추정으로 이어지는 방법입니다. 그러나 다른 할당 체계는 또한 잠재적 결과로부터 치료의 독립성을 체계적으로 보장 할 수있다. 그렇다면 왜 무작위 할당이 필요한가요? 달리 말하면, 비 랜덤 할당 체계에 비해 무작위 할당의 장점은 무엇입니까?

를 각 요소가 0 (치료에 할당되지 않은 단위) 또는 1 (치료에 할당 된 단위) 인 치료 할당의 벡터라고 하자 . JASA 기사에서 Angrist, Imbens 및 Rubin (1996, 446-47) 은 경우 치료 할당 가 무작위 라고 말합니다. 모두 \ mathbf {C}\ mathbf {C'} 되도록 \ IOTA ^ T \ mathbf {C} = \ IOTA ^ T \ mathbf {C '} 여기서 \ IOTA 인 모든 요소가 1 인 열 벡터ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

즉, 제 대입이다 Zi 포함 할당 벡터 중 어느 경우 랜덤 m 처리 지정이 포함 다른 벡터처럼 보인다 m 처리를 할당한다.

그러나 치료 과제에서 잠재적 결과의 독립성을 보장하기 위해 연구의 각 단위가 치료에 배정 될 확률이 동일하도록 보장하는 것으로 충분합니다. 그리고 대부분의 치료 할당 벡터가 선택 될 확률 이 0 이더라도 쉽게 발생할 수 있습니다 . 즉, 비 랜덤 할당에서도 발생할 수 있습니다.

다음은 예입니다. 정확히 두 개를 처리하는 네 개의 단위로 실험을 진행하려고합니다. 여섯 가지 가능한 할당 벡터가 있습니다 :

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

여기서 각 숫자의 첫 번째 숫자는 첫 번째 단위의 처리 여부를 나타내고 두 번째 숫자는 두 번째 단위의 처리 여부를 나타냅니다.

할당 벡터 3과 4의 가능성을 배제하고 다른 벡터 각각이 같은 확률 (25 %)을 갖는 실험을 실행한다고 가정 해 봅시다. 이 체계는 AIR 의미에서 무작위 할당이 아닙니다. 그러나 기대에 따르면 평균 치료 효과에 대한 편견없는 추정으로 이어집니다. 그리고 그것은 우연이 아닙니다. 피험자에게 치료에 대한 동일한 배정 확률을 부여하는 배정 체계는 ATE의 편견없는 추정을 허용합니다.

그렇다면 AIR 의미에서 무작위 할당이 필요한 이유는 무엇입니까? 나의 주장은 무작위 추론에 뿌리를두고있다. 모델 기반 추론의 관점에서 생각하면 AIR 정의가 더 방어적인 것으로 보입니까?


3
나는 Angrist et al.을 읽지 않았으므로 어쩌면 뭔가 빠졌을 지 모르지만 나는 당신의 구절에 퀴즈가 있습니다. 치료가 잠재적 인 결과와 무관하다는 것을 보장하기 위해 무작위 배정을 사용하지 않습니다. 실제 실험에서 치료가 결과와 독립적인지 여부는 치료와 결과 사이에 직접적인 인과 관계가 있는지 여부에 달려 있습니다. 오히려 무작위 할당은 치료가 숨어있는 변수 (또는 잠재적 혼란 자)와 무관하다는 것을 보장합니다 . 우리가 배제하고자하는 치료 이외의 결과에 의해 결과가 초래되었을 가능성이 있습니다.
gung-복직 모니카

1
@ gung, 나는 당신이 "잠재적 인 결과"와 "결과"를 혼란스럽게 생각합니다. 무작위 배정이 결과 (즉, 관찰 결과)로부터 치료의 독립성을 보장하지는 않습니다. 그러나 잠재적 결과는 관찰 결과와 동일하지 않으며 무작위 할당은 잠재적 결과와 치료의 독립성을 보장합니다. 이 시점에서 확대하기 위해 원본 게시물을 편집하지 않습니다. 그렇게하면 주요 주제에서 멀어지게됩니다. 그러나 en.wikipedia.org/wiki/Rubin_causal_model 이이 시점에서 도움이 될 수 있습니다.
user697473

3
"[T]는 치료 과제에서 잠재적 결과의 독립성을 보장하기 위해, 연구의 각 단위가 치료에 배정 될 확률이 동일하게하기에 충분하다." 이것은 올바르지 않습니다. 당신이 등록되어 있다고 가정 남성과 연구에서 여성을. 공정한 동전 뒤집기 : 머리라면 모든 여성을 치료 그룹에, 모든 남성을 통제 그룹에 할당하십시오. 꼬리가 있으면 모든 수컷은 치료군에, 모든 암컷은 대조군에 속합니다. 각 피험자는 치료 그룹에 50 %의 배정 가능성을 가지지 만 치료는 성별과 완전히 혼동됩니다. xx
whuber

1
@ whuber, 귀하의 의견이 정확하지 않습니다. 이유를 확인하려면 가정 = 1 남자의 잠재적 인 결과가 (즉, Y (1) = 1, Y (0) = 0이다 , 여자의 경우 = 1 사람이 아니면 0, 처리합니다.) 잠재적 결과는 Y (1) = -1 및 Y (0) = 2입니다. (특정 잠재적 결과는 중요하지 않지만 작은 정수는 일을 단순하게 유지합니다.) 그런 다음 E [Y (1) | Z] = E [Y (1)] = 0. E [Y (0)]에 대해 동일한 동등성을 유지합니다. 일반적으로 할당 메커니즘은 성별과 혼동되지 않으며 편향되지 않은 ATE 추정치를 생성합니다. 내가 오해가 있으면 알려주세요. xYm
user697473

3
물론, 추정은 정지 된 클럭이 바이어스되지 않은 시간의 추정치를 제공하는 것과 같은 의미에서 "비 편향적"이다! 실제로, 그보다 더 나쁩니다.이 무작위 선택 방법은 성별뿐만 아니라 치료에 기인 할 수없는 결과를 산출합니다. 이것이 혼란스러운 의미입니다. 실험에서 유용한 정보를 모두 없애면서 편견없는 결과를 얻는 데 초점을 맞추는 것은 아기에게서 나오는 속담입니다.
whuber

답변:


8

이것은 gung의 의견에 따릅니다. 전반적인 평균 치료 효과는 중요하지 않습니다.

당신이 가정 피사체가 세 사이이고 새로운 당뇨병 사례 및 , 그리고 개 이상의 새로운 당뇨병 환자 . 치료에 절반을 할당하려고합니다. 동전과 머리를 뒤집어 놓고 모든 젊은 환자와 꼬리를 치료하고 모든 노인 환자를 치료해보십시오. 각각100051510003050%치료에서 선택 될 수 있으므로 치료의 평균 결과에 치우 치지 않지만 많은 정보를 버리게됩니다. 청소년 당뇨병 또는 더 어린 환자가 II 형 또는 임신성 당뇨병을 가진 노인 환자보다 훨씬 더 양호하거나 더 나쁜 반응을 보인 것은 놀라운 일이 아닙니다. 관찰 된 치료 효과는 편향되지 않을 수 있지만, 예를 들어 무작위 할당을 통해 발생하는 것보다 훨씬 더 큰 표준 편차를 가질 수 있으며 큰 표본에도 불구하고 많은 것을 말할 수 없습니다. 무작위 배정을 사용하는 경우, 각 연령 그룹에서 약 건의 사례가 치료를받을 가능성이 높 으므로 각 연령 그룹 내에서 치료하지 않은 치료를 비교할 수 있습니다. 500

무작위 할당을 사용하는 것보다 더 잘 수행 할 수 있습니다. 치료에 대한 반응에 영향을 줄 수 있다고 생각되는 요인이 발견되면 해당 속성을 가진 대상이 무작위 할당을 통해 발생하는 것보다 더 고르게 분할되도록 할 수 있습니다. 랜덤 할당을 사용하면 모든 요인을 동시에 합리적으로 잘 처리 할 수 ​​있으므로 나중에 여러 가지 가능한 패턴을 분석 할 수 있습니다.


고마워요, 더글러스 이 대답은 나에게 의미가 있습니다. 기록을 위해, 귀하의 예 또는 위의 @ whuber의 예와 같은 극단적 인 것을 생각하지 못했습니다. 나는 우리가 단지 몇 가지 치료 벡터를 고려에서 제거하는 경우 대신에 생각하고있었습니다. (고객이 "이 사람 또는 그 사람을 치료할 수 있지만 둘 다를 치료할 수는 없다"고 말하는 경우를 고려하십시오.) 그러나 귀하의 일반적인 요점은 내가 생각한 가벼운 경우에도 적용됩니다.
user697473

벡터를 몇 개만 제거하면 추출 할 수있는 정보의 양을 많이 변경하지 않는 것 같습니다. 이것을 정확하게 정량화하는 것은 어려울 수 있습니다. 아마도 너무 비관적 인 순진한 경계가 있습니다.
Douglas Zare

@DouglasZare 나는 당신의 극단적 인 예에 대해 질문이 있습니다. 목표는 치료가 젊은이와 노인 환자 모두에게 효과적인지 여부를 찾는 것입니다. 그런 다음, 분석법은 모든 사람이 치료 를받는 잠재적 결과 분포 와 모든 사람들이 관리하는 잠재적 결과 분포 에서 대표 샘플로 간주 할 수없는 두 개의 샘플을 생성 합니다. 따라서 관찰 된 치료 효과는 편향됩니다FtFc
KevinKim

1

귀하의 예에서 2와 5도 남겨두고 모순되지 않을 수 있습니다. 아이템 레벨에서 1 또는 6을 선택할 확률이 1 : 1 일 때 1 또는 0 일 확률은 여전히 ​​동일합니다. 그러나 이제 3과 4를 제거하여 수행 한 작업이 더 명확 해집니다.


고마워요, 존 그래 정확 해. 각 유닛에 동일한 치료 할당 가능성을 부여하는 방식으로 나머지 벡터를 사용하는 한 원하는 조합으로 원하는만큼의 치료 할당 벡터를 제거 할 수있는 것 같습니다.
user697473

나는 당신이 내가 말하는 것을 얻는다고 생각하지 않습니다. 내가 제시 한 것은 논란의 여지가있는 논란의 여지가 있습니다.
John

당신의 예는 극단적이지만, 나는 그것에 대해 터무니없는 것을 보지 못합니다. 논란의 여지가없는 할당 체계 (벡터 1과 6 만 사용하는 것과 같은)는 평균적인 치료 효과의 편견없는 추정으로 직접 이어질 수 있습니다. 따라서 편향되지 않은 ATE 추정치를 얻기 위해 무작위 할당이 필요하지 않습니다. 물론, 2에서 5까지의 벡터를 제거하는 것이 좋지 않은 이유가있을 수 있습니다 ( 위의 Douglas Zare의 의견 참조) . 나는 아직 이러한 이유에 대해 생각하지 않았습니다.
user697473

당신은해야합니다. 당신이 그들을 제거 할 수없는 이유입니다.
John

1

숨어 있거나 혼란스러운 변수 중 하나는 시간 (또는 도구 드리프트, 시료 저장의 영향 등)입니다.
따라서 무작위 화에 반대하는 주장이 있습니다 (더글라스가 말한 것처럼 : 무작위 화보다 낫습니다). 예를 들어, 시간이 지남에 따라 사례의 균형을 유지하려는 것을 미리 알 수 있습니다. 성별과 연령의 균형을 유지하고 싶다는 것을 미리 알 수 있듯이.

다시 말해, 6 가지 방식 중 하나를 수동으로 선택하려면 1100 (또는 0011)이 결정적으로 나쁜 선택이라고 할 수 있습니다. 가장 먼저 버린 가능성은 시간에 가장 균형이 잡힌 것들입니다. 그리고 요한이 2 번과 5 번 (당신이 항의하지 않은)에 대해 나눠달라고 제안한 후에 ​​최악의 두 사람이 남았습니다.
다시 말해, 어떤 체계가 "좋은"직관인지는 불행히도 나쁜 실험 설계로 이어집니다 (IMHO 이것은 매우 일반적입니다; 아마도 주문이 더 좋아 보일 수도 있습니다-그리고 실험하는 동안 논리적 인 순서를 추적하는 것이 더 쉽습니다).

비 랜덤 화 방식으로 더 잘할 수는 있지만 훨씬 더 나빠질 수도 있습니다. IMHO, 당신은 비 랜덤 방식으로 갈 경우, 당신이 사용하는 특정 비 랜덤 방식에 대해 물리적 / 화학적 / 생물학적 / 의료 / ... 인수를 줄 수 있어야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.