어떤 인과성 이론을 알아야합니까?


16

응용 통계 학자 / 경제학자로 인과 관계에 대한 이론적 접근법은 무엇입니까?

나는 (아주 조금) 알고있다

어떤 개념을 놓치거나 알고 있어야합니까?

관련 : 머신 러닝에서 인과 관계의 기초가되는 이론은 무엇입니까?

나는이 흥미로운 질문들과 답을 읽었 지만 ( 1 , 2 , 3 ) 다른 질문이라고 생각합니다. 그리고 예를 들어 "인과 관계" 는 통계 학습의 요소 에서 언급되지 않은 것을보고 매우 놀랐습니다 .


2
Andrew Gelman의 AJS : Gelman, A. (2011)의 인과 관계에 대한 여러 작품에 대한 검토를 확인하십시오 . 인과성 및 통계 학습. 미국 사회학 저널, 117 (3), 955-966. doi : 10.1086 / 662659 . 그것은 루빈과 진주의 작품뿐만 아니라 다른 것들에 대한 구체적인 언급과 함께 사회 과학의 인과 관계에 대한 짧은 개요입니다. 참고 문헌을 수색하기에 좋은 장소.
paqmo

1
우선, (John Stuart) Mill의 방법. en.wikipedia.org/wiki/Mill's_Methods
noumenal

Granger 인과 관계에 대한 잘못된 해석과 관련하여 허용되는 답변 아래 내 의견을 참조하십시오.
Richard Hardy

답변:


17

원인이 제 시간에 그 효과보다 우선해야한다는 것은 논란의 여지가 없지만 시간 우선 순위로 인과 적 결론을 내리려면 다른 가짜 관계 소스 중에서도 혼란이 없다고 주장해야합니다.

잠재적 결과 (Neyman-Rubin) 인과 관계 그래프 / 구조 방정식 모델링 (진주)에 대해서는 이것이 잘못된 딜레마라고 말하고 두 가지를 모두 배워야합니다.

첫째, 이것이 인과성에 대한 반대 의견이 아님 을 주목하는 것이 중요합니다 . Pearl이 말한 것처럼 (인과 적) 추론 작업에 대한 계층 구조가 있습니다.

  1. 관측 예측
  2. 중재 중 예측
  3. 반상

첫 번째 작업의 경우 관측 변수의 공동 분포 만 알고 있으면됩니다. 두 번째 작업에서는 관절 분포와 인과 구조를 알아야합니다. 마지막 작업, 반 상식의 경우 구조 방정식 모델의 기능적 형태에 대한 정보가 추가로 필요합니다.

따라서 반 상식에 대해 이야기 할 때 두 관점 사이에는 공식적인 동등성이 있습니다 . 차이점은 잠재적 인 결과는 사실과는 반대되는 진술을 취하고 DAG에서는 반대의 사실 은 구조 방정식에서 도출 된 것처럼 보인다는 것 입니다. 그러나 그들이 "동등한"것인지 물어 보면 왜 둘 다 배우는 것이 귀찮습니까? 사물을 표현하고 이끌어내는 "쉬움"의 관점에서 차이가 있기 때문입니다.

예를 들어, 잠재적 결과 만 사용하여 M-Bias . 사실, 지금까지의 경험은 그래프를 전혀 연구하지 않은 연구자들도 그것을 알지 못한다는 것입니다. 또한 모델의 실질적인 가정을 그래픽 언어로 캐스팅하면 경험적으로 테스트 가능한 의미를 도출하고 식별 가능성에 대한 질문에 답하는 것이 계산적으로 더 쉬워집니다. 다른 한편으로, 사람들은 때때로 반 사실 자체에 대해 직접 생각하기가 더 쉬운 것을 발견하고이를 파라 메트릭 가정과 결합하여 매우 구체적인 쿼리에 응답합니다.

더 많은 것을 말할 수 있지만 여기서 중요한 것은 "두 언어를 구사하는"방법을 배워야한다는 것입니다. 참조를 들어, 여기 시작하는 방법 당신은 확인할 수 있습니다.


1
PO로 표현하기 쉽지만 DAG에서는 표현할 수없는 것의 예를 제공 할 수 있습니까?
Guilherme Duarte

@GuilhermeDuarte 조정 수량 예를 들어 중첩 된 반 사실
Carlos Cinelli

3
Granger 인과 관계에 대한 귀하의 견해 (적어도 여기에 설명되어 있음)는 약간 부정확하다고 생각합니다. 그레인저 인과성아르 자형이자형아르 자형 그 의미 의 역사는 예측력 을 추가했다 자체는 예측에 사용됩니다 . 따라서 수탉은 일출에 대한 과거 데이터를 기반으로 일출 예측을 개선하지 않기 때문에 Granger- 원인 일출을 일으키지 않습니다.
Richard Hardy

@RichardHardy 나는 당신이 옳다고 생각합니다. 아마도 일출 1 시간 전에 항상 까마귀가 울리는 완벽한 수탉은 일출 시계열의 선형 모델 (일출이 정확히 동일하지 않기 때문에)을 넘어선 예측력을 가질 수 있지만 완벽한 모델입니다. 아마 아무것도 추가하지 않습니다.
카를로스시 넬리

Granger 인과 관계는 변수 B가 더 필요하고 따라서 Granger 인과 관계를 정당화하기 위해 B 히스토리 만있는 열등한 예측 모델을 사용하는 것을 제안하지 않는다고 생각합니다. 오히려, B의 자신의 이력을 사용하여 가능한 한 좋은 모델을 목표로 삼은 다음 A를 (일부 형태로) 추가하는 것이 B를 예측하는 데 도움이되는지 확인하십시오. 물론 "완벽한 수탉"은 다소 유토피아적인 개념입니다. 이것을 감안할 때, 이것을 반영하기 위해 답을 편집하는 것이 좋습니다.
Richard Hardy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.