요인 / 변수를 어떻게“통제”합니까?


19

내가 이해하기에 "통제"는 통계에서 두 가지 의미를 가질 수 있습니다.

  1. 대조군 : 실험에서 대조군의 구성원에게는 치료가 제공되지 않았다. 예 : 위약 대 약물 : 한 그룹에 약물을 투여하고 다른 그룹에는 약물을 투여하지 않습니다 (대조군). "제어 된 실험"이라고도합니다.

  2. 변수 제어 : 특정 독립 변수의 효과를 분리하는 기술. 이 기법들에 주어진 다른 명칭들 중 일부는 "계산", "상수 유지", "제어", 일부 변수이다. 예를 들어, 축구 시청 연구 (예 : 좋아하지 않음)에서 성별이 편향을 일으킨다 고 생각할 때, 즉 남성이 여성보다 더 좋아할 수 있으므로 성별의 영향을 원할 수 있습니다.

그래서 제 질문은 포인트 (2)입니다. 두 가지 질문 :

일반적으로 변수를 "통제"/ "계정 지정"하는 방법은 무엇입니까? 어떤 기술이 사용됩니까? (회귀 측면에서 ANOVA 프레임 워크).

위의 예에서, 남성과 여성을 선택하는 것이 무작위로 통제를 구성합니까? 즉, "무작위"는 다른 효과 를 제어 하는 기술 중 하나 입니까?


3
회귀 및 분산 분석 측면에서 변수에 대한 제어는 일반적으로 변수가 모형에 포함되었음을 의미합니다.
Glen

Glen이 말했듯이 모델에 포함시키는 것이 좋습니다. 그러나 랜덤 화는 모델에 포함되지 않은 효과로 인한 바이어스를 방지하는 데 사용됩니다. 디자인이 생성되면 사람들은 종종 균형을 맞추고 각 치료에서 같은 성별의 수를 확보합니다. 랜덤 화 및 카운터 밸런스에만 전적으로 의존하는 문제는 이러한 편향을 분산으로 변환하여 어떤 요인이 활성화되어 있는지 관찰하기가 어렵다는 것입니다.
neverKnowsBest

답변:


16

이미 회귀의 변수를 포함하여 일반적으로 수단을 제어 말했듯이 (@EMS가 가리키는 아웃 등이이 달성에 어떤 성공을 보장하지 않습니다, 그는 이에 대한 링크 ). 이 주제에 대해 다음과 같이 투표가 많은 질문과 답변이 이미 있습니다.

이 질문들에 대한 대답은 모두 관찰 적 (상관적) 틀 안에서 묻는 질문에 대한 아주 좋은 치료법이며, 더 많은 질문은 여기 에서 찾을 수 있습니다 .

그러나 실험 또는 ANOVA 프레임 워크 내에서 구체적으로 질문을하고있는 경우이 주제에 대해 더 많은 생각을 할 수 있습니다.

실험 프레임 워크 내에서 서로 다른 실험 조건에서 개인 (또는 다른 관측 단위)을 무작위 화하여 변수를 제어합니다. 근본적인 가정은 결과적으로 조건들 사이의 유일한 차이점은 실험적 치료법이라는 것입니다. 정확하게 무작위 배정 할 때 (즉, 각 개인이 각 조건에있을 가능성이 동일한 경우) 이것은 합리적인 가정입니다. 또한 랜덤 화만으로도 관측에서 인과 적 추론을 도출 할 수 있습니다. 이것이 다른 요인이 결과에 책임을지지 않는 유일한 방법이기 때문입니다.

그러나 실험 프레임 워크 내에서, 즉 해당 종속 변수에 영향을주는 다른 알려진 요소가있을 때 변수를 제어해야 할 수도 있습니다. 통계적 검정력을 향상 시키려면이 변수를 제어하는 ​​것이 좋습니다. 이를 위해 사용되는 일반적인 통계 절차는 공분산 분석 (ANCOVA)이며 기본적으로 변수를 모형에 추가합니다.

이제 핵심은 다음과 같습니다. ANCOVA가 합리적이기 위해서는 그룹에 대한 할당이 무작위이고 그룹이 제어되는 공변량이 그룹화 변수와 상관되지 않는 것이 절대적으로 중요합니다.
불행히도 종종 무시되어 결과를 해석 할 수 없게됩니다. 밀러 앤 채프먼 (2001) 은이 정확한 문제에 대해 실제로 읽을 수있는 소개 (즉, ANCOVA 사용 여부)를 제공합니다 .

많은 장소에서 수많은 기술적 처리에도 불구하고 공분산 분석 (ANCOVA)은 잠재적 인 공변량에 대한 실질적인 그룹 차이, 특히 정신 병리학 연구에서 실질적인 그룹 차이를 다루는 데 널리 사용되는 접근법으로 남아 있습니다. 게시 된 기사는 근거없는 결론에 도달하며 일부 통계 텍스트는이 문제를 무시합니다. 이러한 경우 ANCOVA의 문제점을 검토합니다. 많은 경우, 잠재적 공변량에 대한 실제 그룹 차이를 "수정"또는 "통제"한다는 피상적으로 매력적인 목표를 달성 할 수있는 방법이 없습니다. ANCOVA의 오용을 줄이고 적절한 사용을 장려하기 위해 교과서 및 기타 일반적인 프레젠테이션에서 거의 표현되지 않은 실질적인 혼란을 강조하면서 이미 사용 가능한 수학적 비평을 보완하는 비 기술적 토론이 제공됩니다.


Miller, GA, & JP Chapman (2001). 공분산에 대한 오해 분석. 비정상 심리학 저널 , 110 (1), 40–48. 도 : 10.1037 / 0021-843X.110.1.40


이 질문에 대한 요점을 강조하기 위해 (매우 자주 묻는) 변수에 대한 매우 강력한 가정 하에서도 단순히 모델에 변수를 포함시키는 것이 그 효과를 "제어"한다고 보장하지 않는 것이 좋습니다 종속 변수와 단조롭게 관련됩니다. 다른 의견에 링크 된 기사를 참조하십시오.
ely

1
@EMS 좋은 지적. 텍스트의 시작 부분에주의 메모와 링크를 추가했습니다. 추가 할 내용이 더 있다면 내 텍스트를 자유롭게 편집하십시오.
Henrik

0

변수를 제어하기 위해 관련 특성에서 두 그룹을 균등화 한 다음 연구중인 문제의 차이점을 비교할 수 있습니다. B-school은 과거 몇 년이 지났으므로 공식적으로가 아니라 예를 통해서만 이것을 설명 할 수 있습니다.

당신이 말할 경우 :

브라질 은 국가 소득이 3,524 억 달러이고 스위스는 551 억 달러이므로 스위스 보다 부유하다

당신은 절대적인 용어로는 정확할 것입니다. 그러나 세상에 대한 지식을 가진 12 세 이상의 사람은 그 진술에도 문제가 있다고 의심 할 것입니다.

스위스의 인구를 브라질의 인구로 상승시킨 다음 소득을 다시 비교하는 것이 좋습니다. 따라서 스위스 인구가 브라질의 규모라면 소득은 다음과 같습니다.

(1 억 2 천 8 백만 / 8,5 백만) * 551 억 달러 = 1,612 억 달러

이로 인해 브라질보다 약 4 배 많은 3,600 억 달러가 부자입니다.

그렇습니다. 평균 소득을 비교하는 1 인당 접근 방식을 취할 수도 있습니다. 그러나 위의 접근 방식은 여러 번 적용 할 수 있습니다.


1
당신은 질문에서 의미하는 의미에서 "통제"보다는 어떤 형태의 정규화를 묘사하고있는 것 같습니다 .
whuber

사실, 나는 그것들이 같다고 생각합니다. 당신이 그렇게 생각하지 않는 경우, 둘 사이의 차이에 정교한 주시기
Heccate Newb

이 스레드에 이미 표시된 다른 답변에 추가해야한다고 생각하지 않습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.