데이터에서 인과 관계를 어떻게 찾습니까?


11

열 "A", "B"가있는 테이블이 있다고 가정하겠습니다.

"A"로 인해 "B"가 발생하는지 확인하는 통계적 방법이 있습니까? 피어슨의 r을 실제로 사용할 수는 없습니다.

  • 값 간의 상관 관계 만 테스트합니다.
  • 상관 관계가 원인이 아님
  • Pearson의 r은 선형 관계 만 상관시킬 수 있습니다

그래서 여기에 다른 옵션이 있습니까?


1
없기. 이러한 데이터를 통해 높은 수준의 상관 관계를 입증 할 수 있습니다. 원인을 증명할 수 없습니다.


1
... 그래서, 반복 내 뒤를 인과 당신이 숫자에서 만들 수 있겠 그냥 뭔가 : 인과 관계는 상관없는 , 인과 관계는 상관 관계가없는 ...
JM은 통계하지

1
Judea Pearl (2011 Turing Award 수상자)의 "Causality"를 참조하십시오.

답변:


4

지금까지 답변과 의견은 기본적으로 실제 수준에서는 정확하지만 완전성을 위해 베이지안 통계와 그래프 이론을 기반으로하는 소위 인과성 모델에 대한 연구가 있습니다. 따라서 일반적으로 상관 관계가 실제로 인과 관계를 암시하지는 않지만 인과 관계를 해결하려는 더 복잡한 모델이 있습니다. 자세한 내용은 Judea Pearl의 Causality 책 을 참조하십시오. 그러나 이것은 매우 무거운 수학이며 아마도 원하는 것이 아닙니다.


2

데이터가 관측 적이라하더라도 인과 관계에 대해 신빙성있게 논쟁 할 수있는 소위 준 실험적 방법이 많이 있습니다. 이러한 방법은 일반적으로 관심 변수의 외인성 변동 원인을 찾는 데 의존합니다.

나는 "대부분 무해한 계량 경제학"책에 좋고 접근하기 쉬운 개요가 있다고 생각합니다. 여기에는 사람들 (의미 : 경제학자)이 (적어도 때때로) 믿는 모든 준 실험적 방법이 포함됩니다. 그들은 예를 들어 trb456에 의해 언급 된 방법을 다루지 않습니다 (같은 이유로 많은 사람들이 그들을 믿지 않습니다).


1

인과 관계를 확인하려면 무작위 테스트를 수행해야합니다. 당신은 당신의 시험 대상을 가지고, 품질 A를 갖기 위해 절반을 선택하고 그것을 갖지 않기 위해 절반을 무작위로 선택합니다. 그런 다음 두 그룹간에 품질 B에 통계적으로 유의 한 차이가 있는지 확인합니다.

측정 하기 전에 무작위 화를 수행하는 것이 중요합니다 . 특히, 데이터 세트가 제공된 경우 이미 측정 한 경우 인과 관계를 결정하는 것은 불가능합니다.

원하는 무작위 화 테스트를 수행하는 것이 불가능할 수도 있습니다. 예를 들어, 키가 커지면 체중이 더 많이 나가는 지 어떻게 테스트 할 수 있습니까? 확실히 키와 몸무게 사이에는 상관 관계가 있지만 한 그룹의 사람들을 '키가 큰'그룹과 하나의 '짧은'그룹에 무작위로 할당 할 수는 없습니다. 이 경우 무작위 테스트를 수행 할 수 없습니다.


0

Somers 'd는 피어슨의 상관 계수가 데이터 세트에 대해 수행하는 방식으로 서수 변수 간의 관계를 설명하는 데 사용됩니다.


1
인과 관계를 확립하는 데는 숫자 이상이 필요하다는 데 동의합니다. 서수 변수의 사용은 어떻게 질문에 들어 옵니까?
Michael R. Chernick

1
@MichaelChernick Somers 'D는 비대칭 연관 측정입니다. "비가 오면 흐리다"와 "흐리면 비가오다"를 구별 할 수 있습니다. 서수 이상의 데이터에 적용됩니다. 원인을 설정하지는 않지만 방향성을 설정합니다.
Dave Harris
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.