최근 블로그 게시물 중 하나 에서 Andrew Gelman 은 다음과 같이 말합니다.
나는 심슨의 역설에 반의 상이나 잠재적 인 결과가 필요하다고 생각하지 않는다. 나는 조작 할 수 없거나 조작이 직접 관심이없는 변수로 심슨의 역설을 설정할 수 있기 때문에 이것을 말합니다.
Simpson의 역설은 예측 변수를 더 추가하면 회귀 계수가 변경되는 일반적인 문제의 일부로, 부호 뒤집기가 실제로 필요하지는 않습니다.
다음은 두 가지 점을 모두 설명하는 교수법에서 사용하는 예입니다.
성별과 신장으로 인한 수입을 예측하는 회귀 분석을 실행할 수 있습니다. 나는 섹스의 계수가 $ 10,000 (즉, 같은 높이의 남자와 여자를 비교하면 평균 남자가 $ 10,000를 더 만들 것입니다 )이고 키의 계수는 $ 500입니다 (즉, 두 남자 또는 두 여자를 비교) 키가 다른 사람은 키가 큰 사람이 평균 키당 500 달러를 더 많이 벌 수 있습니다 ).
이 소들을 어떻게 해석 할 수 있습니까? 나는 높이의 코프가 해석하기 쉽다고 생각합니다 (동일한 성별의 두 사람을 다른 높이와 비교하는 것은 상상하기 쉽습니다). 사실 원시의 많은 것만 큼 섹스 를 통제 하지 않고 키를 회귀시키는 것이 어떻게 든“잘못”된 것처럼 보일 것 입니다 키가 큰 사람과 키가 큰 사람의 차이는 남성과 여성의 차이로 설명 할 수 있습니다. 그러나 위의 모델에서 섹스의 계수는 해석하기가 매우 어려워 보입니다. 예를 들어 66 인치의 남자와 여자를 비교하는 이유는 무엇입니까? 그것은 키 큰 여자와 키가 작은 남자의 비교 일 것입니다. 이 모든 추론은 모호하게 보이는 것처럼 보이지만 잠재적 인 결과를 사용하여 그것에 대해 생각하는 것은 이치에 맞지 않습니다.
나는 그것에 대해 숙고하고 (또한 게시물에 댓글을 달았습니다) 여기에 더 명확하게 이해해야 할 것이 있다고 생각합니다.
성별 해석에 대한 부분까지는 괜찮습니다. 그러나 나는 키가 작은 남자와 키가 큰 여자를 비교하는 데 어떤 문제가 있는지 알지 못합니다. 여기에 내 요점이있다 : 사실 그것은 더 큰 의미가있다 (남자들이 평균적으로 키가 크다는 가정이 주어진다). 똑같은 이유로 '짧은 남자'와 '짧은'여자를 비교할 수는 없습니다. 소득의 차이는 키의 차이로 일부 설명됩니다. 키가 큰 남자와 키가 큰 여자의 경우도 마찬가지이며, 키가 큰 여자와 키가 큰 남자의 경우도 마찬가지입니다. 따라서 기본적으로 키의 영향은 키가 작은 남자와 키가 큰 여자를 비교할 때만 제거됩니다 (성에 대한 계수 해석에 도움이 됨). 인기있는 매칭 모델 뒤에 유사한 기본 개념에 종을 울리지 않습니까?
Simpson의 역설 뒤에 숨겨진 아이디어는 집단 효과가 하위 그룹 현명한 효과와 다를 수 있다는 것입니다. 이것은 그의 관점 2와 관련이 있으며 높이를 혼자 제어해서는 안된다는 사실을 인정한다는 사실입니다 (우리는 가변 바이어스를 생략했습니다). 그러나 나는 이것을 성계 수에 관한 논란과 관련시킬 수 없었다.
좀 더 명확하게 표현할 수 있을까요? 아니면 내 이해에 대한 의견?