상관 관계에 대한 많은 설명이있을 수 있으므로 상관 관계는 원인을 암시하지 않습니다. 그러나 인과 관계는 상관 관계를 의미합니까? 직관적으로, 인과 관계가 존재한다는 것은 반드시 상관 관계가 있음을 의미한다고 생각합니다. 그러나 내 직감이 통계에서 항상 나에게 도움이되지는 않았습니다. 인과 관계는 상관 관계를 의미합니까?
상관 관계에 대한 많은 설명이있을 수 있으므로 상관 관계는 원인을 암시하지 않습니다. 그러나 인과 관계는 상관 관계를 의미합니까? 직관적으로, 인과 관계가 존재한다는 것은 반드시 상관 관계가 있음을 의미한다고 생각합니다. 그러나 내 직감이 통계에서 항상 나에게 도움이되지는 않았습니다. 인과 관계는 상관 관계를 의미합니까?
답변:
위의 많은 답변에서 언급했듯이 인과 관계는 선형 상관 관계를 의미하지 않습니다 . 많은 상관 관계 개념은 선형 통계에 크게 의존하는 필드에서 비롯되므로 일반적으로 상관 관계는 선형 상관 관계와 같습니다. 위키 피 디아 기사는 정말이 이미지처럼,이에 대한 괜찮아 소스입니다 :
예를 들어 네 번째 예의 포물선 모양과 같이 맨 아래 줄의 일부 그림을보십시오. 이것은 @StasK 답변에서 발생하는 것입니다 (소음이 약간 추가됨). Y는 X에 의해 완전히 발생할 수 있지만 숫자 관계가 선형이 아니며 대칭이 아닌 경우에도 상관 관계는 0입니다.
찾고있는 단어는 상호 정보입니다 . 이것은 일반적인 비선형 버전의 상관 관계입니다. 이 경우, 귀하의 진술은 사실입니다. 원인은 높은 상호 정보를 암시합니다 .
엄격한 대답은 "아니오, 인과 관계가 반드시 상관 관계를 암시하는 것은 아닙니다"입니다.
고려 및 . 원인은 더 강해지지 않습니다 : 는 결정 합니다. 그러나 와 상관 관계 는 0입니다. 증명 : 이러한 변수의 (공동) 모멘트는 다음과 같습니다. ; ; 사용 홀수 모멘트가 모두 0 인 표준 정규 분포의 속성 (즉, 모멘트 생성 함수에서 쉽게 도출 할 수 있음). 따라서 상관 관계는 0과 같습니다.
일부 의견을 다루기 위해 :이 주장 이 효과를 발휘할 수 있는 유일한 이유는 의 분포가 0에 중심을두고 0에 대해 대칭 이기 때문입니다 . 실제로, 충분한 수의 모멘트를 갖는 이러한 특성을 가진 다른 분포는 장소 , 예를 들어 또는 Laplace 에서 균일합니다 . 지나치게 단순화 된 주장은 모든 양수 값에 대해 같은 크기 의 의 음수 값과 동일 할 가능성이 있으므로 를 제곱 할 때 더 큰 값이 더 크거나 작은 값과 관련이 있다고 말할 수는 없습니다 의. 그러나 하면 , , 및 . 이것은 가 0보다 작은 각 값에 대해 0보다 큰 값이 훨씬 높 으므로 큰 값은 더 큰 값과 연관됩니다 . (후자는 비 중앙 분포를 가지며, Wikipedia 페이지에서 차이를 가져 와서 관심이 있다면 상관 관계를 계산할 수 있습니다.)
본질적으로 그렇습니다.
상관 관계는 원인을 넘어서는 상관 관계에 대한 다른 설명이있을 수 있기 때문에 인과 관계를 암시하지 않습니다. 그러나 A가 B의 원인이 되려면 어떤 방식 으로든 연관되어야합니다 . 상관 관계가 반드시 선형 일 필요는 없지만 상관 관계가 있음을 의미합니다.
일부 의견 제시 자들이 제안했듯이 상관 관계보다는 '종속성'또는 '연관'과 같은 용어를 사용하는 것이 더 적합 할 것입니다. 주석에서 언급했듯이 간단한 선형 상관 관계를 넘어서는 분석에 대한 응답으로 "상관은 인과 관계를 의미하지 않습니다"를 보았으므로 목적 상 "상관 관계"를 기본적으로 A와 B의 연관성
@EpiGrad의 답변에 추가. 많은 사람들에게 "상관"은 "선형 상관"을 의미한다고 생각합니다. 비선형 상관의 개념은 직관적이지 않을 수 있습니다.
그래서 저는 " 상관 될 필요는 없지만 관련 될 필요가 있습니다"라고 말할 것 입니다. 우리는 그 물질에 동의하지만 그 물질을 가로 지르는 가장 좋은 방법에 대해서는 동의하지 않습니다.
그러한 인과 관계의 한 예 (적어도 사람들은 인과 적이라고 생각합니다)는 전화 응답 가능성과 소득 간의 가능성입니다. 소득 스펙트럼의 양쪽 끝에있는 사람들이 중간에있는 사람들보다 자신의 전화에 응답 할 가능성이 낮다는 것이 알려져 있습니다. 인과 적 패턴은 빈곤층 (예 : 청구서 수집가 방지)과 부유층 (예 : 기부 요청을 피하는 사람)에 따라 다르다고 생각됩니다.
여기에는 뉘앙스가 있습니다. 인과 관계 는 상관 관계 나 통계적 의존성을 암시 하지 않습니다 . 최소한 우리가 일반적으로 생각하는 단순한 방식이나 일부 답변이 제안하는 방식 ( 또는 변환 등) 은 아닙니다 .
다음과 같은 인과 모델을 고려하십시오.
즉, 와 는 모두 유발 합니다.
이제 보자 :
관찰하지 않는다고 가정하십시오 . 그 주목 . 즉, 가 (비모수 적 구조식 의미에서) 유발 하더라도 의존성을 보지 못합니다! 원하는 비선형 변환을 수행 할 수 있으며 여기 에 와 의 한계 의존성이 없기 때문에 의존성을 나타내지 않습니다 .
트릭은 와 가 유발 하더라도 평균 인과 관계는 거의 0입니다. 와 함께 때 (정확한) 의존성 만 볼 수 있습니다 ( 및 는 의미하지 않음을 나타 냅니다). 그래서, 그래, 하나는, 비록 그 주장 할 수 발생 의 한계 인과 효과 에 우리의 의존도가 표시되지 않는 이유는 그래서, 제로 와 . 그러나 이것은 단지 문제가 얼마나 미묘한 차이를 설명하기 때문에 순진하게 생각하는 방식이 아니라 ( 와 상호 작용 ) 유발 합니다.
간단히 말해서 나는 다음과 같이 말할 것이다 : (i) 인과 관계 는 의존성을 암시 한다; 그러나, (ii) 의존성은 기능적 / 구조적 의존성 이며, 생각하고있는 특정 통계적 의존성으로 해석 될 수도 있고 번역되지 않을 수도 있습니다.
아무 변화가없는 경우를 제외하고 원인과 효과는 상관 관계가 될 것입니다 전혀 빈도와 원인의 크기와 전혀 변화에 전혀 그 인과 힘에. 다른 원인은 원인이 정확히 반대 효과를 가진 다른 인과 변수와 완벽하게 상관되어 있는 경우 일 수 있습니다 . 기본적으로 이들은 생각 실험 조건입니다. 현실에서 인과 관계는 어떤 형태의 의존성을 의미 할 것입니다 ( 선형 적 상관 관계 는 아니지만 ).
여기에 큰 답변이 있습니다. Artem Kaznatcheev , Fomite 및 Peter Flom 은 인과 관계가 일반적으로 선형 상관 관계보다는 의존성을 의미한다고 지적합니다. Carlos Cinelli 는 생성 기능 설정 방법으로 인해 의존성이없는 예를 보여줍니다.
이 종속성이 실제로 잘 작동하는 데이터 세트 종류에서 실제로 사라질 수있는 방법에 대한 요점을 추가하고 싶습니다. Carlos의 사례와 같은 상황은 단순한 "생각 실험 조건"으로 제한되지 않습니다.
자체 규제 프로세스 에서는 의존성이 사라집니다 . 예를 들어 항상성은 내부 체온이 실내 온도와 독립적으로 유지되도록합니다. 외부 열은 체온에 직접 영향을 주지만 체온을 안정적으로 유지하는 신체의 냉각 시스템 (예 : 발한)에 영향을줍니다. 매우 빠른 간격으로 온도를 샘플링하고 매우 정밀한 측정을 사용하면 인과 관계를 관찰 할 수 있지만 정상적인 샘플링 속도에서는 체온과 외부 온도가 독립적으로 나타납니다.
자가 조절 과정은 생물학적 시스템에서 일반적입니다. 그것들은 진화에 의해 생산됩니다. 체온 조절에 실패한 포유류는 자연 선택에 의해 제거됩니다. 생물학적 데이터로 작업하는 연구원은 인과 관계가 데이터 세트에서 사라질 수 있음을 알고 있어야합니다.
상관 관계가없는 원인이 RNG가 아닐까요?
받아 들여진 대답이 암시하는 것처럼 '상관 관계'라는 단어에 대한 믿을 수 없을만큼 제한된 해석을 사용하고 있다면 어리석은 질문입니다. 인구 증가 또는 강도.
권리?
그런 다음 다시, 당신은 더 많은 것을 논의 할 수 있습니다. 다른 것에 의해 영향을받는 것의 가시성 , 인과 같은 것으로 생각되지만 실제로는 당신이 측정하고 있다고 생각하는 것을 측정하지 않습니다 ...
네, 짧은 대답은 "예, 엔트로피를 만들 수없는 한"입니다.