상관 관계의 비 일시성 : 성별과 뇌의 크기, 뇌의 크기와 IQ 간의 상관 관계는 있지만 성별과 IQ의 상관 관계는 없음


18

블로그에서 다음 설명을 발견했으며 상관의 비 일시성에 대한 자세한 정보를 얻고 싶습니다.

다음과 같은 확실한 사실이 있습니다.

  • 평균적으로 남성과 여성의 뇌량에는 차이가 있습니다
  • IQ와 뇌 크기 사이에는 상관 관계가 있습니다. 상관 관계는 0.33이므로 IQ 변동성의 10 %에 해당합니다.

이 구내 1과 2에서 논리적으로 다음과 같이 보입니다. 평균적으로 여성은 남성보다 IQ가 낮습니다. 그러나 그것은 오류입니다! 통계에서 상관 관계는 전이되지 않습니다. 증거는 IQ 테스트 결과 만 살펴보고 남자와 여자의 IQ가 평균적으로 다르지 않다는 것을 보여줍니다.

이 상관 관계의 비 과도성에 대해 조금 더 깊이 이해하고 싶습니다.

IQ와 뇌 크기의 상관 관계가 0.9 (1이 아닌 것으로 알고 있음) 인 경우 평균적으로 여성이 남성보다 IQ가 낮다는 사실을 추론하는 것이 여전히 잘못된 것입니까?

나는 IQ (및 시험의 한계), 성 차별주의, 여성 고정 관념, 오만 등에 대해 이야기하기 위해 여기에 있지 않습니다 (2). 나는 그 오류에 대한 논리적 추론을 이해하고 싶습니다.


(1) 내가 알지 못하는 것 : 네안데르탈 인은 호모 사피엔스보다 뇌가 더 크지 만 더 똑똑하지는 않았다.

(2) 나는 여성이며 전반적으로, 나는 나 자신 또는 다른 여성이 남성보다 똑똑하지 않다고 생각한다. 나는 사람들의 가치가 무엇인지 카운트하기 때문에 IQ 테스트에 신경 쓰지 않는다. 지적 능력.


프랑스어로 된 원본 :

les에 실마리가없는 사람들은 살아남는다 :

  • 다른 언어로 볼륨을 바꾸다 cérébral en moyenne entre hommes et femmes
  • 상관 관계는 QI et volume cérébral; la corrélation est 0.33 et donac à 10 % de la variabilité에 해당

Deces prémisses 1 et 2, il découler logiquequeque : les femmes ont en moyenne un QI inférieur aux hommes.

Mais c'est erreur de raisonnement! 통계적으로, les corrélations ne sont pas transitives. La preuve, c'est que pour en avoir le cœur net, il deuffre de lé ré résultats des QI, et ceux-ci montrent que les QI des hommes et des femmes ne diffèrent pas en moyenne.

여기에 이미지 설명을 입력하십시오


5
나는이 진술들이 상관 관계와 어떤 관련이 있는지 이해하지 못한다 (그리고 "전이성"을 언급하는 것은이 맥락에서 전적으로 부적절 해 보인다). 결론은 결국 평균 차이 와 관련이 있습니다. 이 통계 (첫 번째 모멘트)는 상관 관계 (두 번째 모멘트에서 파생 됨)와 무관합니다. 상관이 완전 인 경우에도 첫 번째 변수의 평균 차이를 기반으로 두 번째 변수의 평균 차이에 대한 결론을 도출 할 수 없습니다. ±1
whuber

5
제곱 상관의 합이 1보다 큰 경우 양의 상관 관계가 전이적임을 (Langford, Schwertman 및 Owens (2001)) 알 수 있습니다. ρXY2+ρYX2>1ρXZ>0
CloseToC 2019 년

2
@ whuber : 예,하지만 이것은 X와 Y 평균 (뇌 크기와 IQ)의 관계에 관한 질문이 아닙니다. 두 개의 다른 군집에서 Y의 평균 관계에 관한 질문입니다 ... 만약 뇌 크기와 IQ 간의 상관 관계가 완벽하고 (즉, IQ가 뇌 크기의 선형 함수), 평균 뇌 크기가 남자와 여자 사이에 다르면, 평균 IQ가 남자와 여자 사이에 다르다는 것입니다.
amoeba는 Reinstate Monica

2
@Amoeba 감사합니다. 인용은 이해하기 시작합니다 (최종!). 그러나 이것을 "상관성 전이성"이라고하는 것은 솔직하게 오도 될 정도로 모호합니다. (구문은 원래 프랑스어로되어 있으므로 번역을 비난 할 수도 없습니다.)
whuber

3
@amoeba 그럴듯하다. 그러나 나는 당신이 거기에 도착하기 위해 물건을 약간 늘려야한다고 생각합니다! 인용문은 성별과 뇌의 크기 사이의 관계를 "상관"으로 특성화하지 않으며 두 그룹 간의 평균 차이로만 나타납니다. 우연히 상관 관계의 표준 척도 아님) . 그러나 우리는 "상관의 부족"또는 이와 유사한 것으로 "상관"을 넓은 의미로 이해해야한다고 생각합니다.
whuber

답변:


16

예, 여전히 오류 일 것입니다.

다음은 네 가지 상황을 보여주는 매우 간단한 그림입니다. 각 경우에 빨간색 점은 여성을 나타내고 파란색 점은 남성을 나타내고 가로 축은 뇌 크기를 나타내고 세로 축은 IQ를 나타냅니다. 다음과 같이 네 가지 데이터 세트를 모두 생성했습니다.

  • 남성 ( )과 여성 ( 28- 단위는 임의적 임) 사이의 평균 뇌 크기에는 항상 같은 차이가 있습니다. 이는 모집단 평균이지만,이 차이는 합리적인 표본 크기로 통계적으로 유의할만큼 충분히 큽니다.2228

  • 남성과 여성 사이의 평균 IQ에는 항상 0의 차이가없고 ( 모두 ) 성별과 IQ 사이에는 0의 상관 관계가 없으며;100

  • 뇌의 크기와 IQ 간의 상관 관계의 강도는 그림과 같이 다양합니다.

상관 관계

왼쪽 상단의 하위 플롯에서 성별과의 상관 관계 (남자와 여자를 별도로 계산 한 다음 평균을 계산 한 값)는 인용과 같이 입니다. 오른쪽 위 서브 플롯에서 전체 상관 관계 (남성과 여성이 함께)는 0.3 입니다. 귀하의 인용문에는 0.33 의 숫자가 무엇을 의미 하는지 명시되어 있지 않습니다 . 왼쪽 하단 서브 플롯에서 성별 내 상관 관계는 가상의 예와 같이 0.9입니다 . 오른쪽 아래 서브 플롯에서 전체 상관은 0.9 입니다.0.30.30.330.90.9

따라서 상관 관계 값을 가질 수 있으며 전체적으로 또는 그룹 내에서 계산되는지는 중요하지 않습니다. 상관 계수가 어떻든간에 성별과 IQ간에 상관 관계가없고 평균 IQ에서 성별 차이가 전혀 없을 가능성이 매우 높습니다.


비 일시성 탐색

@kjetil이 제안한 접근 방식에 따라 전체 가능성의 공간을 살펴 보겠습니다. 세 개의 변수 있고 (일반성의 손실없이) x 1x 2 간의 상관 이 a > 0 이고 x 2x 3 간의 상관 이 b > 0이라고 가정하십시오 . 문제는 x 1 사이 의 상관 λ 의 최소 ​​가능한 양의 값은 무엇입니까?x1,x2,x3x1x2>0엑스2엑스>0λ엑스1엑스? 때때로 하는가 긍정적으로, 또는 항상 0이 될 수 있습니까?

상관 행렬은 과는 음이 아닌 행렬식을 갖는, 즉 보유 D E t R = - λ 2 + 2 λ - ( 2 + B 2 - 1 ) 0 , λa b ± 사이에 있어야 함을 의미합니다.

아르 자형=(1λ1λ1)
이자형아르 자형=λ2+2λ(2+21)0,
λ두 근이 모두 양수이면 가능한 최소값λ는 작은 근과 같습니다 (그리고λ는 양수 여야합니다!). 이 두 근 사이에 0이 있으면λ는 0이 될 수 있습니다.
ab±(1a2)(1b2).
λλλ

이를 수치 적으로 해결 하고 다른 ab에 대해 가능한 최소 양의 값을 플로팅 할 수 있습니다 .λab

비 일시성 탐색

비공식적으로, a > 0b > 0 이면 λ > 0 이라고 결론을 내릴 수 있다면 상관 관계는 전 이적 이라고 말할 수 있습니다 . 우리는 대부분의 값 ab대해 λ 가 0 일 수 있다는 것을 알 수 있습니다. 이는 상관 관계가 전이되지 않음을 의미합니다. 그러나 ab의 값이 충분히 높은 경우 상관 관계 λ 는 양수 여야 하므로 결국 "어느 정도의 전이도"가 있지만 매우 높은 상관 관계로만 제한됩니다. 상관 관계 ab 둘 다a>0b>0λ>0abλabλ ab 높아야합니다.

우리는이 "과도 성"에 대한 정확한 조건을 알아낼 수 있습니다. 위에서 언급 한 것처럼, 작은 근은 양수 여야합니다. 즉 으로a2+b2>1과 같습니다. 이것은 원의 방정식입니다! 실제로 위의 그림을 보면 파란색 영역이 1/4의 원을 이루는 것을 알 수 있습니다.ab(1a2)(1b2)>0a2+b2>1

특정 예에서, 성별, 뇌의 크기 사이의 상관 관계는 (아마도 매우 온건 = 0.5 )와 뇌 크기와 지능 지수 사이의 상관 관계는 B = 0.33 (청색 영역 내에서 단단히 인 2 + B 2 < 1 )을 의미 λ 는 양수, 음수 또는 0 일 수 있습니다.a=0.5b=0.33a2+b2<1λ


원래 연구의 관련 인물

성별과 뇌에 대한 논의를 피하고 싶었지만 원문 ( Gur et al. 1999 ) 에서 전체 수치를 보면 언어 IQ 점수에는 성별 차이가 없지만, 공간 IQ 점수의 명백하고 중요한 차이! 서브 플롯 D와 F를 비교합니다.

Gur et al.


2
나는 당신이 생성 한 그 음모를 좋아합니다. 종이에서 나온 것들은 그리 많지 않습니다.
shadowtalker

1
@ AleksandrBlekh : 진실을 말하면 확실하지 않습니다. "열지도"? "형상 플롯"이지만 색상이 있고 윤곽이없는?
amoeba는 Reinstate Monica

2
감사합니다. 함께옵니다. 그러나 (1) 첫 번째 음모에서 성별과의 상관 관계가 0이라는 것을 실제로 보여주지는 않습니다. (2) 마지막에 상관 관계의 "전이성"에 대해 설명했지만 이 구절의 의미 를 아직 설명하지 않았습니다 . 그것은 전 이적 관계의 일반적인 수학적 의미를 가지고 있지 않기 때문에 약간의 설명이 가치가 있습니다. (BTW 끝에서, 당신은 토론을 한 것으로 나타났습니다 보다는 λ 즉, 분석했다. 절대 아니라 상관 관계 자체보다 상관 관계를.)|λ|λ
whuber을

1
@ whuber : 아주 좋은 말, 감사합니다. (1) 실제로 성별과의 관계는 제로! 표본 관계 대신 모집단 상관 관계를보고하려면이 수치를 변경해야한다고 생각합니다. 데이터를 직접 생성 할 때 모집단 모수를 완전히 제어 할 수 있습니다. (2) 전이성에 의해 나는 비공식적으로 y 사이의 양의 상관 관계 , 그리고 yz 사이의 양의 상관 관계는 xz 사이의 양의 상관 관계를 의미합니다 . 내 요점은 일반적으로 잘못되었지만 충분히 강한 상관 관계에 대해서는 정확하다는 것입니다. 편집하겠습니다. (3) ab 가 모두 0 이면 0 .xyyzxzab0λ0
amoeba는 Reinstate Monica

1
이 길고 자세한 답변에 대해 아메바에게 감사드립니다 (그리고 추가되어 매우 환영합니다)! 그것은 사물을 분명하게 만듭니다! 이 개념은 통계적으로 훈련되지 않은 뇌를 이해하기가 너무 어려워서 문제에 빛을 비췄습니다! 답변을 게시하는 데 시간을 내 주셔서 감사합니다.
MagTun

8

x 3 을 둘 다 서로 관련된 다른 변수 (뇌량과 같은)로 정의 해 봅시다 . cor ( x 1 , x 2 ) = λ 라고 가정 해 봅시다 .x1=IQ,x2=genderx3λ에 가능한 최소값은얼마입니까? 상관 행렬은 양의 반 정밀도 여야하므로 행렬식이 음수가 아니어야합니다. 그것은 불평등을주기 위해 이용 될 수 있습니다. 우리가 해보자 : 상관 관계 매트릭스는 R = ( 1 λ ρ λ 1 ρ ρ ρ 1 ) 의 그 다음 우리가 계산할 수있는 결정 ρ

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ첫 번째 행을 따라 확장하여 : ρ ) 부등식 ρ 2λ + 1
detR=1(1ρ2)λ(λρ2)+ρ(λρρ)=1λ22ρ2+2λρ20,
. 값ρ=0.9λ0.62가됩니다.ρ2λ+12ρ=0.9λ0.62

최신 정보:

의견에 응답하여 위의 답변을 다소 업데이트했습니다. 이제 무엇을 만들 수 있습니까? 위의 계산에 따르면 IQ와 뇌량 사이의 상관 관계는 0.9 (상관적보다 훨씬 큼)입니다. 그런 다음 성별과 IQ 간의 상관 관계는 0.62 이상이어야합니다. 그게 무슨 뜻이야? 의견에서 일부 사람들은 이것이 남녀 간의 평균 차이에 대해 아무 것도 암시하지 않는다고 말합니다. 그러나 그것은 사실이 될 수 없습니다! 예, 정규 분포 변수의 경우 관계없이 상관 관계와 평균을 할당 할 수 있습니다. 그러나 성별 등의 변수가 0 인 하나의 변수 이다 상관 관계와 평균 차이의 관계는. 구체적으로, IQ는 정규 분포이며, 성별은 이산적이고 0 대 1입니다. 평균 라고 가정하자p=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20 IQ 평균 차이에 대한 정보가 잘못되었습니다! 성별이 연속 변수라면 사실 일 것입니다. 이 사실은 이항 분포의 경우 분산이 평균의 함수라는 사실과 관련이 있습니다. 우리가 위에서 한 것은 실제로 이것을 공분산 / 상관으로 확장하는 것입니다.

ρ=0.33λ0.7822λ=0


1
cor(x1,x2)0.62E(x1)E(x2)

5
+1-그러나 남성과 여성 IQ의 상관 관계 개념은 그러한 값을 계산할 수 없으므로 다소 혼란 스럽습니다.
Andy W

1
남녀 IQ의 상관 관계는 무엇을 의미합니까?!
amoeba는 Reinstate Monica

예, 맞습니다. @amoeba! 혼동을 표현하기 위해 올바른 단어를 사용하지 않았을 수도 있지만 (통계에 익숙하지 않기 때문에 어렵습니다) 변수는 실제로 성별, IQ 및 뇌 크기입니다.
MagTun

7

이것은 직접 효과와 간접 효과 를 설명하기 위해 경로 다이어그램을 사용 하는 것과이 두 가지가 전체 상관 관계에 어떤 영향을 미치는지에 대한 상황입니다.

원래 설명에 따라 아래에 상관 관계 행렬이 있습니다. 뇌의 크기는 IQ와 약 0.3의 상관 관계를 가지며, 암컷과 IQ는 서로 0의 상관 관계를 갖습니다. 나는 여성과 뇌의 크기 사이의 음의 상관 관계를 -0.3으로 채 웁니다 (내가 그것을 훨씬 작게 추측해야 하지만 이것은 설명 목적으로 사용됩니다).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

IQ가 뇌 크기의 함수이고 여성 인 회귀 모델에 적합하면 경로 다이어그램으로이를 설명 할 수 있습니다. 화살표의 부분 회귀 계수를 채웠으며 B 노드는 뇌 크기를 나타내고 F 노드는 여성을 나타냅니다.

enter image description here

뇌의 크기를 조절할 때 이러한 상관 관계가 주어지면 여성은 IQ와 긍정적 인 관계를 갖습니다. 한계 상관 관계가 0 일 때 왜 이런가? 선형 경로 다이어그램이있는 규칙 ( Wright, 1934 )에 따라 뇌 크기와 간접 효과를 제어 할 때 직접 효과의 함수로 한계 상관 관계를 분해 할 수 있습니다.

합계에프,IQ=곧장에프,IQ+간접에프,,IQ

이 표기법에서 합계에프,IQ=오호(에프,IQ). 원래의 정의에 따라 우리가 알고 이 총 효과를 제로가 될 수 있습니다. 이제 우리는 직접 효과와 간접 효과를 알아 내야합니다. 이 다이어그램에서 간접 효과는 단순히 뇌의 크기를 통해 여성에서 IQ 로의 다른 화살표를 따르고 있습니다. 이는 뇌의 크기와 IQ 의 부분적 상관 관계 에 곱한 여성과 뇌의 상관 관계 입니다.

간접에프,,IQ=오호(에프,)오호(,IQ|에프)0.099=0.30.33

총 효과가 0이므로 직접 효과는 단순히 간접 효과의 반대 부호와 크기 여야 하므로이 예에서 직접 효과는 0.099와 같습니다. 자, 여기 우리는 여성의 예상 IQ를 평가할 때 두 가지 다른 답변을 얻지 만, 질문을 지정할 때 처음에 예상했던 것과는 다른 상황이 있습니다. 암수 대 암수의 한계 예상 IQ를 간단히 평가할 때, 정의한대로 차이가 없습니다 (상관 관계 없음). 뇌의 크기에 따라 예상되는 차이를 평가할 때 여성은 남성보다 IQ가 더 큽니다.

kjetil이 그의 대답에 표시하는 한계를 감안할 때 뇌 크기와 IQ 사이의 더 큰 상관 관계 (또는 여성과 뇌 크기 사이의 더 작은 상관 관계)를이 예에 삽입 할 수 있습니다. 전자를 늘리면 여성과 남성의 조건부 IQ의 불일치가 여성에게 유리하며, 후자를 줄이면 차이가 더 작아집니다.


제공된 그림을 보면 여성의 뇌량과 IQ의 긍정적이고 강한 상관 관계를 보여줍니다.
Alecos Papadopoulos

1
@Andy W :이 어리석은 질문을하는 것이 정말 부끄럽지만 노드 그래프를 그리는 데 어떤 소프트웨어를 사용하셨습니까?
mugen

1
inkscape @mugen에서 빠른 일이었습니다. 더 많은 시간이 걸리면 라텍스와 Tikz를 사용하는 것이 더 좋다고 생각합니다 .
Andy W

+1 두 번째 공식 뒤에있는 이론을 알려주시겠습니까?
Aleksandr Blekh

2
@AleksandrBlekh-내가 인용 한 Wright 논문은 중요한 출처입니다. 유대 진주 는 더 간단한 치료법이 있지만 그의 인과 관계 책 에서 더 광범위한 주석으로 들어갑니다 . (선형 모델의 경우 구조 방정식 모델링 서적에서 종종 분해가 커서 처리됩니다.)
Andy W

3

순전히 추상적 인 수학 답변을 제공하려면 V 뇌량과 IQ 인덱스 사용하다1 남자를 색인하고 2여성을 색인합니다. 다음은 사실이라고 가정합니다.

(1)E(v1)>E(v2)=βE(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

Note that while the quoted text talks about "correlation between brain volume and IQ" in general, the supplied image makes a distinction with the two trend-lines (i.e. it shows the correlation for the two subgroups separately). So we consider them separately (which is the correct way to go).

Then

ρ(v1,q1)>0Cov(v1,q1)>0E(v1q1)>E(v1)E(q1)

(2)E(v1q1)E(q1)>E(v1)

and

ρ(v2,q2)>0Cov(v2,q2)>0E(v2q2)>E(v2)E(q2)

(3)E(v2q2)βE(q2)>E(v1)

Does the above obtained inequalities necessitate E(q1)>E(q2)??

To check this assume on the contrary that (4)E(q1)=E(q2)=q¯

Then it must be the case that

(5)(2),(4)E(v1q1)q¯>E(v1)

and that

(6)(3),(4)E(v2q2)βq¯>E(v1)

Well, it certainly can be the case, that inequalities (5) and (6) hold at the same time, and so "equal IQ on average" is perfectly compatible with the initial assumptions that we took as facts.
In fact it could very well happen that we could have a higher average IQ from women than for men, for the same set of facts in (1).

In other words, the correlation assumptions/facts in (1) do not impose any constraint whatsoever about the relation between average IQ's at all. All possible relation between E(q1) and E(q2) may hold, and be compatible with the assumptions in (1).


2
Despite all the calculations shown here, I still do not see how correlation reveals anything at all (or imposes any constraints whatsoever) concerning relationships between mean values.
whuber

@whuber The whole answer is about showing that it doesn't. The last sentences say exactly that. Let's add one more to that effect.
Alecos Papadopoulos

But this is absolutely basic: one doesn't need an entire page of equations to show it! It suffices to observe that correlation coefficients are location-invariant, QED. Am I misinterpreting the question?
whuber

1
@whuber With all due respect and no offense meant to anyone, but I fear that you are "misinterpreting" the knowledge level of the OP. Otherwise, the question would not have been posted.
Alecos Papadopoulos

4
I would encourage you, then, to reflect on whether and how any reply that relies heavily on mathematical equations is appropriate for addressing posters who appear to be asking for elementary expositions of basic concepts. This is a subtle issue because sometimes that is exactly the right approach. Furthermore, the degree to which one uses mathematics--and how one expounds the mathematical ideas--can be a matter of taste. But IMHO this kind of reply is effective only when the mathematics is clear and consistently focused on an essential idea.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.