다음은 심슨의 역설이 존재한다는 '그림으로 증명 된'것으로 제시된 많은 시각화에 대한 질문이며 아마도 용어에 대한 질문입니다.
심슨의 역설은 매우 간단 현상을 설명하고 (이유의 수치 예를 제공하는 것입니다 왜 이 깊고 재미 발생할 수에게). 역설은 한계 연관이 각 조건부 연관과 다른 방향을 갖는 2x2x2 우발 테이블 (Agresti, Categorical Data Analysis)이 존재한다는 것입니다.
즉, 두 하위 집단의 비율 비교는 둘 다 한 방향으로 진행될 수 있지만 결합 모집단의 비교는 다른 방향으로 진행됩니다. 기호로 :
존재 , B , C , D , E , F , G를 , H 되도록 +의 B
하지만 와
이는 Wikipedia 의 다음 시각화에서 정확하게 표현됩니다 .
분수는 단순히 해당 벡터의 기울기이며 예제에서 짧은 B 벡터가 해당 L 벡터보다 더 큰 기울기를 가지고 있지만 결합 된 B 벡터는 결합 된 L 벡터보다 작은 기울기를 가짐을 쉽게 알 수 있습니다 .
여러 가지 형태로 매우 일반적인 시각화가 있으며, 특히 심슨의 위키 백과 참조 앞면에 있습니다.
이것은 숨겨진 변수 (두 개의 하위 모집단을 구분하는)가 다른 패턴을 표시 할 수있는 방법에 대한 혼란의 좋은 예입니다.
그러나 수학적으로 이러한 이미지는 Simpson의 역설이라고 알려진 현상을 기반으로하는 우발성 테이블의 표시에 해당하지 않습니다 . 첫째, 회귀선은 우발성 테이블의 데이터를 계산하지 않고 실제 값 세트 데이터를 초과합니다.
또한 회귀선에서 기울기와 임의의 기울기를 사용하여 데이터 세트를 만들 수 있지만 우발 표에서는 기울기가 얼마나 다른지에 대한 제한이 있습니다. 즉, 모집단 의 회귀선은 주어진 부분 집단의 모든 회귀에 직교 할 수 있습니다 . 그러나 Simpson의 역설에서 회귀 기울기는 아니지만 하위 집단의 비율이 다른 방향으로도 합병 된 인구와 너무 멀어 질 수는 없습니다 (다시 말하면 Wikipedia의 비율 비교 이미지 참조).
나에게 그것은 심슨의 역설을 시각화하는 것으로 후자의 이미지를 볼 때마다 되돌아 가기에 충분하다. 그러나 (제가 잘못 부르는) 예제가 어디에서나 보이므로 궁금합니다.
- 비상 테이블의 원본 Simpson / Yule 예제에서 회귀선 시각화를 정당화하는 실제 값으로 미묘한 변환이 누락 되었습니까?
- 분명히 심슨은 혼란스러운 오류의 특정 사례입니다. 용어 '심슨의 역설은'지금이되었다 동일시 그래서 무엇이든 수학, 오류를 교란으로 어떤 숨겨진 변수를 통해 방향으로 변화가 심슨의 역설이라고 할 수 있는가?
부록 : 다음은 2xmxn (또는 연속적으로 2xm) 테이블에 대한 일반화의 예입니다.
샷 유형에 합쳐지면 방어자가 가까이있을 때 플레이어가 더 많은 샷을하는 것처럼 보입니다. 샷 유형 (실제 바구니와의 거리)별로 그룹화하면보다 직관적으로 예상되는 상황이 발생하며 더 많은 샷이 수비수보다 멀어집니다.
이 이미지는 내가 심슨을보다 지속적인 상황 (수 비자의 거리)으로 일반화 한 것으로 간주한다. 그러나 회귀선 예제가 어떻게 심슨의 예제인지 아직 아직 알지 못합니다.