상관 관계 = 0.2는 "5 명 중 1 명만"연관이 있음을 의미합니까?


48

에서 바보 브레인 : 신경 과학자는 머리가 정말 최고입니다 무엇을 설명 , 딘 버넷 썼다

높이와 지능의 상관 관계가 보통 인 것으로 인용 , 높이와 정보를 의미 만에 관련있는 것처럼 보이는 에 사람들입니다.1 50.215

나에게,이 소리는 잘못되었다 : 나는 그 사람에 대해 우리가 아는 유일한 것이 다른 척도 (여기서는 높이)라면 하나의 척도 (여기서는 지능)를 예측하려고 할 때 발생하는 (부족) 오류와 같은 상관 관계를 이해한다. 상관 관계가 또는 예측에 오류가 발생하지 않으며 상관 관계가 이면 더 많은 오류가 있습니다. 따라서 상관 관계가 아니라, 사람 하나에 적용됩니다 에서 사람들입니다.1 0.8 1 5110.815

나는 질문을 보았지만 답을 이해하기에는 수학에 충분하지 않습니다. 선형 관계의 강점에 대해 이야기하는 이 대답 은 내가 이해하지만 확실하지 않은 줄로 보입니다.


6
@JamesPhillips, 당신이 말하는 것은 자체가 아니라 입니다. 만일 다음 이므로 4 %. r r = 0.2 r 2 = 0.04r2rr=0.2r2=0.04
Richard Hardy

4
4 %는 20 %보다 훨씬 더 의미가 있습니다. 정정 해 주셔서 감사합니다. 동의합니다.
James Phillips

29
이 책의 0.01 % 샘플은 나머지 부분에서 넌센스가 무엇인지 궁금해합니다.
Nick Cox

11
나는이 게시물을 좋아했습니다. 통계 001 학생 (또는 다른 신생 생물 또는 구직 신청자)에게 물어볼 때 상관 관계가 무엇을 의미하는지 이해할 수 있는지 여부를 즉각적이고 확실하게 결정할 수있는 매우 간단한 질문이기 때문입니다.
whuber

4
나는 바로 대해, 그 책 읽기를 중단 거라고 지금
박사

답변:


69

인용 된 구절이 실제로 올바르지 않습니다. 상관 계수는 전체 모집단 (또는 샘플 상관 계수의 경우 샘플)에 걸친 연관 정도를 정량화합니다. 한 부분은 연관성을 보이고 다른 부분은 그렇지 않은 것으로 인구를 부분으로 나누지 않습니다. 그것은 수있는 인구가 실제로 협회의 다른 학위를 가진 두 개의 하위 집단으로 구성된 경우가 있지만, 혼자 상관 계수는이를 의미하지는 않습니다.


19
또한, 20 %의 사람들이 키와 지능 사이에 완벽한 상관 관계를 보였고 80 %가 0의 상관 관계를 보이지 않은 인구 집단에서도 전체 인구 상관 관계가 반드시 0.2 일 필요는 없습니다. 그 진술은 여러 가지면에서 잘못되었습니다!
핵 왕

핫 네트워크 목록에 들어가는 스레드에서 이상한 일이 발생합니다. 이 대답은 분명히 정확하고 훌륭합니다 ...하지만 57 개의 공감 비는?! :-)
amoeba는 Reinstate Monica가

2
@amoeba 그것이 거칠다고 생각되면 내 최고 점수 답변을 확인하십시오 .
Kodiologist

하하, 당신은 주인입니다!
amoeba는

SE라는 이상한 점을 더하기 위해 무언가를 +1하는 것으로 계산합니까?
Nat

18

아니요, 0.2는 5 명 중 1 명이 상관 관계를 나타내는 것은 아닙니다. 그가 어떻게 말도 안되는지를 모르겠다.

다음은 0.2 숫자의 출처입니다. "높이-지능형 상관 관계의 출처 : 분류 결합을 사용하는 이변 량 ACE 모델의 새로운 통찰", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ 분명히 상관 관계는 강력합니다.

나는 이미 그것에 대해 알고 있었다 : 키가 커질수록 내 IQ가 키에 따라 상당히 상승했다. 이제는 왜 더 이상 똑똑해지지 않는지 알고 있습니다. 키가 안정적입니다.

이것은 물론 농담이지만, "Idiot"책의 저자의 논점은 적어도 내가 아는 한 키와 IQ의 주제 상관 관계 내에서 아무도 측정하지 않는다는 문제를 지적합니다. 나는 당신이 어떻게 그것을 깨끗하게 할 것인지 잘 모르겠습니다. 많은 혼란 스러울 것입니다.

연구자들은 쌍둥이 내, 키와 IQ의 가족 상관 관계 내에서 보는 것과 같은 트릭을 사용한다고 말하면서 혼란스러운 문제를 해결하는 데 도움이됩니다. 아마도 쌍둥이는 비슷한 환경에서 자라고 있으며 동일한 DNA를 가지고 있기 때문에 관찰 연구에서 내인성 및 기타 문제를 해결하는 데 도움이됩니다. 그러나 이것을 모두 무시하면 결론은 "0.2 상관 관계"는 어떤 사람들에게는 상관이 있고 다른 사람들에게는 아무 말도하지 않는 것처럼 말도 안된다는 근거를 제공하지 않는다는 것입니다. 상관 연구 결과에 대한 터무니없는 해석 일뿐입니다.


8
-1 :이 답변의 마지막 단락의 정신을 이해하는 동안 불필요하게 인과성 개념을 도입함에 따라 혼란이 증가한다고 믿습니다 ( why여기서는 관련이 없음).
Jorge Leitao

1
상관 관계가있는 5 명 중 1 명이어야합니다.
Carsten S

@ JorgeLeitão 물론, 어떤 원인도 암시되지 않으며, 함께 자랐습니다. 상관 관계가 있습니다! :)
Firebug

@ JorgeLeitão, NN 연구에 따르면 크기가 중요합니다. 더 큰 두뇌와 더 큰 표본. 우리는 자라서 뇌가 커지고 더 많은 물건을 습득하므로 더 똑똑해 져야합니다. 또한 남성은 평균적으로 여성보다 키가 크므로 평균적으로 똑똑해야합니다.
Aksakal

아, 정말 말도 안되는 일이야
Monica와의 가벼움 경주

8

성명서의 아이러니는 구문 분석하기에 너무 두껍습니다. 본문의 제목을 감안할 때, 나는 뺨이 혀로되어 있다고 가정합니다. 그러나 직감이 무엇이든 중요하다면 이것이 잘못되었다고 말하는 "장"입니다. 불행히도 많은 과학적보고는 우리가 겪지 못한 개념을 다룰 때 직관을 피할 수 없습니다.

사이의 관계를 측정하면 해당 및 사이에 상관 및 나머지 80 %의 인구의 20 %에서 1.0, 0이다. 결과적으로 와 의 전체 상관 관계 는 0.2입니다. 우리는 이것을 약물 역학에서 항상 본다 : 실험적인 약물은 평균적으로 긍정적 인 이점이 있다면 "효과적인"것으로 간주된다; 일반적인 순환계의 많은 약물, 일부는 복용 할 수 있지만 행동이나 유전학과의 상호 작용으로 인해 해를 입을 수 있지만 실제로는 아무도 모릅니다.Y X Y X YXYXYXY

위는 0.2의 상관 관계에 대한 한 가지 가능한 해석입니다. 인생에서 거의 1 또는 0의 상관 관계를 갖는 것들이 거의없고 그러한 불일치 적 상관 관계를 생성하기에 충분히 강력한 수정 효과를 갖는 것들이 거의 없기 때문에 극도로 가져옵니다.


1
"X와 Y의 연관성을 측정 할 때 X와 Y의 상관 관계는 모집단의 20 %에서 1.0이고 나머지 80 %에서 0입니다." -내가 연구에서 그들은 가족 내에서 그리고 쌍둥이 상관 관계를 살펴 보았으며, 전체 인구와 다릅니다. 그러나 이것이 책의 저자가 의도 한 바가 아니라고 생각합니다. 그것이 그가 어떤 상관 관계가 문제인지 해석하는 방법입니다
Aksakal

@Aksakal 흥미롭게도 이러한 분산 성분 방법은 모집단에서 측정 한 것과 동일한 모집단 수준 상관 관계를 추정하기위한 것으로, 현재 환경 영향 (ACE의 E 성분으로 인한 표현형 분산을 "제거"하기 위해 유전성을 사용한다고 주장합니다. 모델) : 고려 된 가설에서 중요한 혼란의 근원.
AdamO

10
상관 관계가 모집단의 20 %에서 1이고 80 %에서 0이면 전체적으로 0.2가 아닙니다. 각 하위 모집단의 상대 분산에 따라 다릅니다.
amoeba는

1
@amoeba 네, 좋은 지적은, 특 발적 시나리오가 그러한 주장을 정당화하는 것이 무엇인지를 더욱 강조합니다.
AdamO

4
"저는 혀가 혀를 was다고 가정합니다." 당신은 내가하는 것보다 더 자선합니다. 단순히 잘못되었습니다. 저자가 의도적으로 현명한 방식으로 잘못되었다고 생각할 이유가 없습니다. 가장 자선 가능한 해석은 저자가 상관 관계의 확률 적 특성을 강조하고 그것을 설명하는 나쁜 방법을 생각하지 않은 채 선택했다는 것입니다. 저자가 지적했을 경우 저자 자신이 동의 할 가능성은 거의 없습니다.
John Coleman

2

올바른 것은 물론 의미있는 해석을 생각해 내기가 어려울 것입니다. 연결은 개별 데이터 요소의 속성이 아닙니다. 한 사람의 키와 지능 만 가지고 있다면 키와 지능이 연관되어 있는지 어떻게 알 수 있습니까? 나는 우리가 키와 지능의 평균을 가졌다면, 둘 다 평균 이상의, 또는 둘 다 평균 미만인 모든 사람들이 "연관"을 보이고 있다고 말할 수 있습니다. 그러나 만약 당신이 완전히 임의의 데이터를 가지고 있다면 (상관 관계가없는), 사람들의 절반이 이런 의미에서 "연관"을 보일 것을 기대해야합니다. .2 (실제로는 .22) 정도의 상관 관계를 갖는 임의의 데이터 세트를 생성했으며 55가이 의미에서 "연관"을 나타냄을 발견했습니다.

Y가 X의 증가하는 함수일 수 있으며 이들 사이의 상관 관계는 단지 0.5입니다. 모든 사람이 모든 작은 사람보다 지능이 높고 키가 큰 사람보다 지능이 낮 으면 절반의 사람들 만이 협회를 보여 준다고 말하는 것은 어리석은 일입니다. 또한 이론적으로 모든 상관 관계를 만드는 특이 치가있을 수 있으며 해당 지점이없는 세트의 상관 관계는 0이됩니다. 인구의 20 %가 음의 상관 관계를 갖고 다른 80 %도 음의 상관 관계를 가질 수 있으며 총 상관 관계는 0.2입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.