열 "A", "B"가있는 테이블이 있다고 가정하겠습니다.
"A"로 인해 "B"가 발생하는지 확인하는 통계적 방법이 있습니까? 피어슨의 r을 실제로 사용할 수는 없습니다.
- 값 간의 상관 관계 만 테스트합니다.
- 상관 관계가 원인이 아님
- Pearson의 r은 선형 관계 만 상관시킬 수 있습니다
그래서 여기에 다른 옵션이 있습니까?
열 "A", "B"가있는 테이블이 있다고 가정하겠습니다.
"A"로 인해 "B"가 발생하는지 확인하는 통계적 방법이 있습니까? 피어슨의 r을 실제로 사용할 수는 없습니다.
그래서 여기에 다른 옵션이 있습니까?
답변:
지금까지 답변과 의견은 기본적으로 실제 수준에서는 정확하지만 완전성을 위해 베이지안 통계와 그래프 이론을 기반으로하는 소위 인과성 모델에 대한 연구가 있습니다. 따라서 일반적으로 상관 관계가 실제로 인과 관계를 암시하지는 않지만 인과 관계를 해결하려는 더 복잡한 모델이 있습니다. 자세한 내용은 Judea Pearl의 Causality 책 을 참조하십시오. 그러나 이것은 매우 무거운 수학이며 아마도 원하는 것이 아닙니다.
인과 관계를 확인하려면 무작위 테스트를 수행해야합니다. 당신은 당신의 시험 대상을 가지고, 품질 A를 갖기 위해 절반을 선택하고 그것을 갖지 않기 위해 절반을 무작위로 선택합니다. 그런 다음 두 그룹간에 품질 B에 통계적으로 유의 한 차이가 있는지 확인합니다.
측정 하기 전에 무작위 화를 수행하는 것이 중요합니다 . 특히, 데이터 세트가 제공된 경우 과 이미 측정 한 경우 인과 관계를 결정하는 것은 불가능합니다.
원하는 무작위 화 테스트를 수행하는 것이 불가능할 수도 있습니다. 예를 들어, 키가 커지면 체중이 더 많이 나가는 지 어떻게 테스트 할 수 있습니까? 확실히 키와 몸무게 사이에는 상관 관계가 있지만 한 그룹의 사람들을 '키가 큰'그룹과 하나의 '짧은'그룹에 무작위로 할당 할 수는 없습니다. 이 경우 무작위 테스트를 수행 할 수 없습니다.
Somers 'd는 피어슨의 상관 계수가 데이터 세트에 대해 수행하는 방식으로 서수 변수 간의 관계를 설명하는 데 사용됩니다.