기계 학습이 인과 관계를 이해하는 데 덜 유용하므로 사회 과학에 덜 흥미로울까요?


42

머신 러닝 / 기타 통계 예측 기법과 사회 과학자 (예 : 경제학자)가 사용하는 통계 종류의 차이점에 대한 나의 이해는 경제학자가 단일 또는 여러 변수의 효과를 이해하는 데 매우 관심이 있다는 것입니다. 규모와 관계가 인과 관계인지 감지. 이를 위해 실험 및 준 실험적 방법 등으로 자신에 관한 결과를 얻습니다.

예측 가능한 머신 러닝 또는 통계 모델링은 종종 이러한 측면을 무시하고 많은 경우 하나의 변수가 결과에 영향을 미치는 특정 정도를 제공하지 않습니다 (로짓과 프로 빗이 두 가지를 모두 수행하는 것처럼 보입니다).

관련 질문은 이론적으로 영감을 얻은 경제 또는 행동 모델이 새로운 영역을 예측할 때 이론적 모델에 비해 어느 정도 유리한가? 머신 러닝 또는 예측 중심 통계학자는 경제 모델이 없으면 공변량이 매우 다른 새로운 샘플을 정확하게 예측할 수 없다는 비판에 대해 무엇을 말하고 있습니까?

나는 사람들이 모든 관점에서 이것을 받아들이는 것을 정말로 기쁘게 생각합니다.


질문. 당신은 '이론적 모델'을 쓰려고 했습니까? 그렇다면 그렇다면 그 의미는 무엇입니까? 아니면 그냥 '이론적'을 의미 했습니까?
Faheem Mitha 4

2
아마도 생성 적 모델과 차별적 모델을보고 있습니까? 머신 러닝은 차별화 된 모델과 기술을 지향합니다.
Wayne

@FaheemMitha : '아토 론적': 이론이 없습니다.
naught101

답변:


32

모델에 데이터를 피팅하는 기본 수준에서 머신 러닝과 통계를 구별하는 공식적인 차이점은 없습니다. 모델 선택, 모델을 데이터에 맞추는 목표, 해석의 확장에 문화적 차이가있을 수 있습니다.

전형적인 예에서 우리는 항상

  • 일부 인덱스 세트 대해 대한 모델 의 컬렉션 ,MiiII
  • 그리고 각각의 에 대해 모델 의 미지의 성분 (매개 변수는 무한 치수 일 수 있음) .iθiMi

피팅 데이터로하는 것은 거의 항상 알 수없는 구성 요소의 최적의 선택을 찾는 구성된 수학적 최적화 문제입니다 만들기 위해 어떤 마음에 드는 기능에 의해 측정 된 데이터를 맞습니다.MiθiMi

모델 중에서 선택하는 것이 표준이 사용 가능한 다양한 기술이 있습니다. 모델 피팅의 목적이 순전히 예측 가능한 경우, 우수한 예측 성능을 얻으려는 시도로 모델 선택을 수행하는 반면, 주요 목표가 결과 모델을 해석하는 경우 다른 모델보다 해석하기 쉬운 모델을 다른 모델보다 더 쉽게 선택할 수 있습니다. 예측력이 더 나빠질 것으로 예상됩니다.Mi

구식 통계 모델 선택 이라고하는 것은 단계적 선택 전략과 결합 된 통계 테스트를 기반으로하는 반면, 머신 러닝 모델 선택은 일반적으로 교차 검증을 사용하여 추정되는 예상 일반화 오류에 중점을 둡니다. 그러나 현재 모델 선택의 개발과 이해는보다 일반적인 근거로 수렴하는 것으로 보입니다 (예 : 모델 선택 및 모델 평균화 참조) .

모델에서 인과 관계 추론

문제의 핵심은 모델을 해석하는 방법입니다 . 얻은 데이터가 신중하게 설계된 실험에서 얻은 것이며 모델이 적절한 경우 모델의 변수 변경 효과를 인과 관계 효과로 해석 할 수 있으며 실험을 반복하고이 특정 변수에 개입하는 경우 우리는 추정 된 효과를 관찰 할 수 있습니다. 그러나 데이터가 관측 가능한 경우 모형의 추정 효과가 관측 가능한 개입 효과와 일치 할 것으로 예상 할 수 없습니다. 이를 위해서는 모델이 "기계 학습 모델"인지 "고전 통계 모델"인지에 관계없이 추가 가정이 필요합니다.

일 변량 모수 추정 및 효과 크기 해석에 중점을 둔 클래식 통계 모델을 사용하여 교육을받은 사람들은 기계 학습 프레임 워크보다이 프레임 워크에서 인과 해석이 더 유효하다는 인상을받습니다. 나는 그렇지 않다고 말할 것입니다.

통계에서 인과 추론의 영역이 실제로 문제를 제거하는 것은 아니지만 인과 결론이 명백한 가정을 만듭니다. 그것들은 테스트수없는 가정 이라고합니다 . 통계의 인과 추론 논문 : Judea Pearl 의 개요 는 읽을만한 좋은 논문입니다. 인과 추론의 주요 기여는 실제로 관찰되지 않은 혼란자가 존재하는 가정 하에서 인과 효과를 추정하는 방법의 수집이며, 그렇지 않으면 주요 관심사입니다. 위의 진주 종이에서 섹션 3.3을 참조하십시오. 좀 더 진보 된 예는 논문 Marginal Structural Models and Causal Inference in Epidemiology에서 찾을 수 있습니다 .

검증 할 수없는 가정이 적용되는지 여부는 중요한 문제입니다. 데이터를 사용하여 테스트 할 수 없으므로 테스트 할 수 없습니다. 가정을 정당화하려면 다른 주장이 필요합니다.

기계 학습과 인과 추론이 만나는 곳의 예 로서 Mark van der Laan과 Daniel Rubin의 Targeted Maximum Likelihood Learning 에 제시된 목표 최대 가능성 추정 의 아이디어는 일반적으로 비모수 추정을위한 기계 학습 기법을 활용하여 "타겟팅 "관심 매개 변수를 향해 후자는 인과적인 해석을 갖는 매개 변수가 될 수 있습니다. Super Learner 의 아이디어관심있는 매개 변수를 추정하기 위해 머신 러닝 기술에 크게 의존하는 것입니다. Mark van der Laan (개인 커뮤니케이션)은 고전적이고 단순하며 "해석 할 수있는"통계 모델이 종종 잘못되었다는 점이 중요합니다. 이로 인해 추정 된 추정자가 치우치고 추정의 불확실성을 너무 낙관적으로 평가할 수 있습니다.


이 놀라운 답변에 감사드립니다 ... 나는 당신이 제공 한 모든 링크를 따라 가기를 기대합니다. 내가 가진 하나의 남아있는 질문은 기술에 관한 것입니다. 관측 데이터를위한 도구 변수와 같은 기계 학습 아날로그가 있습니까? 또한-변수의 무작위 화의 경우, 머신 러닝 대안은 치료 간의 차이에 대한 간단한 t- 검정과 관련하여 무엇입니까? 기계 학습 답변 기술이 필요합니까? 어떤 이점이 있습니까?
d_a_c321

@dchandler, 도구 변수에 대한 나의 경험은 매우 제한적이지만 다시 한번 모델 피팅에 대한 기계 학습과 통계 방법론을 구별 할 공식적인 이유가 없으므로 목적에 부합하는 경우 도구 변수를 포함시킬 수 있습니다. 인과 관계와 관련된 가장 흥미로운 문제는 개입의 영향이라는 것을 알았습니다. 이것은 기본적으로 예측의 문제이지만 아마도 관측 데이터의 분포에 있지는 않습니다.
NRH

@dchandler, 두 번째 질문에 대해서는 머신 러닝의 메소드와 통계의 메소드의 일대일 관계에 대한 질문으로 생각하지 않습니다. 질문에 대답하기 위해 계산 -test : 데이터 거기에 증거 수단이 동일하다는 귀무 가설을 기각 할 수 있습니까? 이것이 흥미로운 지 여부와 -test와 해당 - 가 좋은 대답을 제공 하는지 여부에 대해 오랫동안 토론 할 수는 있지만 기계 학습 대안이 있는지 묻는 데는 아무런 의미가 없다고 생각합니다. t pttp
NRH

그러나 개입을 한 후에 머신 러닝은 어떤 종류의 통계를 사용합니까? 실험 설계의 기본 통계는 일반적으로 뇌-죽이기 쉽다 (t- 테스트를 통한 비교 수단). 계량 경제학에서는 더 많은 가정을 통해 다른 Quantile 또는 처리 효과의 분포를 복구 할 수 있습니다. 기계 학습 분석은 평균을 비교하는 것 이상으로 무엇을 할 것입니까?
d_a_c321

두뇌-죽이기 쉬운 것은 무언가를 계산하는 것이고, 쉽지 않은 것은 필요한 가정을 정당화하는 것입니다. Mark의 TMLE 접근 방식은 효과 크기 (일반적으로 관심 매개 변수, 중재 효과, 관측 효과)를 추정하고 덜 제한적인 모델 가정으로 정직한 신뢰 구간을 제공합니다. 교차 검증을 기반으로 모델을 선택하는 유연한 모델 피팅은 제한적이고 잘못된 파라 메트릭 모델을 피하기 위해 사용됩니다.
NRH

10

소위 "인과 적 추론"에 대한 통계 도구 세트는 상당히 제한적입니다. 이들은 인과 관계를 실제로 평가하기 위해 설계되었으며이를 올바르게 수행하는 것으로 입증되었습니다. 우수하지만 마음의 온유 (또는 그 문제에 대한 뇌)에는 적합하지 않습니다.

그 외에도, 많은 경우에, 인과 관계를 암시하는 능력은 현재 사용중인 기술보다 설계의 결과에 훨씬 더 영향을줍니다. 실험에서 '모든'변수를 제어 할 수 있고 하나의 변수 만 변경하면 변경 한 것의 '결과'를 발생시키는 것을 호출하는 것이 합리적입니다 (불행히도 실제 연구에서는 이러한 극단적 인 경우는 거의 발생하지 않습니다). 직관적이지만 건전한 또 다른 추론은 시간을 기준으로합니다. 무작위로 (하지만 통제 된 방식으로) 변수를 변경하고 그 다음날 또 다른 변경을하면 인과 관계도 모퉁이에 있습니다.

두 번째 단락은 기본적으로 어떤 조건에서 어떤 변수가 변경되었는지 찾기 위해 어떤 방법을 사용하든 작동하므로 이론 상으로는 기계 학습 (ML)이 통계 기반 방법보다 나쁜 이유는 없습니다.

면책 조항 : 매우 주관적인 단락 folowing

그러나 필자의 경험에 따르면 ML 기술은 데이터의 출처 나 수집 방법 (예 : 설계 무시)을 고려하지 않고 데이터 한 덩어리에서 느슨해 지기도합니다. 이 경우 결과가 너무 나빠지지만 인과 관계에 대해 유용한 것을 말하기는 매우 어려울 것입니다. 이것은 것입니다통계적으로 건전한 방법이 동일한 데이터에서 실행될 때 정확히 동일해야합니다. 그러나 통계 배경이 강한 사람들은 이러한 문제에 대해 비판적으로 훈련을 받았으며 모두 잘 진행되면 이러한 함정을 피할 수 있습니다. 아마도 ML 기술에 대한 나쁜 평판을 얻은 ML 기술의 초기 (그러나 부주의 한) 채택 자 (일반적으로 새로운 기술의 개발자는 아니지만 관심 분야에서 일부 결과를 '증명'하고자하는 사람들)의 사고 방식 일 것입니다. 계정. ( 통계가 ML보다 낫다는 말은 아니며 ML을 수행하는 모든 사람들이 조잡하고 통계를 수행하는 사람들은 그렇지 않다는 것을 유의하십시오 )


답변 주셔서 대단히 감사합니다. 인과 관계가 기술보다 설계의 결과에 더 많은 영향을 미친다는 당신의 설명을 정말 좋아합니다. 내가 기술에 대해 가지고있는 한 가지 질문은 기계 학습을위한 도구 변수와 같은 것이 있는지 여부입니다. 또한-변수의 무작위 화의 경우, 머신 러닝 대안은 치료 간의 차이에 대한 간단한 t- 검정과 관련하여 무엇입니까?
d_a_c321

9

저의 견해는 경제학 및 기타 사회 과학에 사용되는 모델이 실제 세계에 예측력이있는 한에만 유용하다는 것입니다. 실제 세계를 예측하지 않는 모델은 단지 영리한 수학입니다. 동료들에게 가장 좋아하는 말은 "데이터는 왕이다"입니다.

귀하의 질문에 예측 접근법에 대한 두 가지 비판이 제기되는 것 같습니다. 먼저 머신 러닝 기술로 제작 된 모델은 해석 할 수 없을 수도 있습니다 . 둘째, 사회 과학에서 사용하는 방법이 기계 학습보다 인과 관계를 밝히는 데 더 유용하다고 제안합니다.

첫 번째 요점을 해결하기 위해 다음과 같은 반론을 제시합니다. 머신 러닝의 현재 유행은 일반인이 이해하기 쉽지 않은 방법 (SVM 및 NN과 같은)을 선호합니다. 그렇다고 모든 기계 학습 기술에이 속성 이있는 것은 아닙니다 . 예를 들어, 유능한 C4.5 의사 결정 트리는 개발의 최종 단계에 도달 한 지 20 년이 지난 후에도 여전히 널리 사용되며 여러 분류 규칙을 출력으로 생성합니다. 나는 그러한 규칙이 로그 확률 비율과 같은 개념보다 해석에 더 적합하다고 주장하지만 주관적인 주장입니다. 어쨌든 그러한 모델 해석 가능합니다.

두 번째 요점을 다룰 때 한 환경에서 기계 학습 모델을 훈련시키고 다른 환경에서 테스트하면 실패 할 가능성이 있지만, 이것이 또한 사실이 아니라고 선험적으로 가정 할 이유는 없습니다. 보다 일반적인 모델 : 하나의 가정 하에서 모델을 작성한 다음 다른 가정 하에서 평가하면 나쁜 결과를 얻을 수 있습니다. 컴퓨터 프로그래밍에서 구를 선택하려면 "쓰레기 수거, 쓰레기 수거"는 기계 학습과 설계 모델 모두에 동일하게 적용됩니다.


9

인스턴스의 절차 참조 번호 인과 추론, 기계 학습 연구의 활성 영역입니다 워크샵 및 이 하나 . 그러나 인과 적 추론 또는 모델 해석이 주요 관심사 일지라도 불투명하게 순전히 예측적인 접근 방식을 병렬로 시도하는 것이 좋습니다. 해석 가능한 모델.


1
돌이킬 수없는? 아마도 당신은 해석 가능한 것을 의미합니까?
Faheem Mitha

4

나는 이미 다른 답변에서 만든 아주 좋은 점을 반복하지는 않지만 다소 다른 관점을 추가하고 싶습니다. 여기서 말하는 것은 다소 철학적이며, 반드시 전문적인 경험에서 비롯된 것이 아니라 물리 과학, 복잡한 시스템 이론 및 기계 학습의 혼합 배경에서 비롯됩니다 (대부분 학부 통계도 인정해야합니다).

머신 러닝과 고전적인 통계적 접근법 (내가 알고있는)의 한 가지 실질적인 차이점은 일련의 가정에 있습니다. 고전 통계에서는 기본 프로세스 및 분포에 대한 많은 가정이 고정되어 있으며 당연한 것으로 여겨지는 경향이 있습니다. 그러나 머신 러닝에서 이러한 가정은 각 모델에 대해 명시 적으로 선택되므로 훨씬 광범위한 가능성이 있으며 가정에 대한 인식이 높아집니다.

우리는 전세계의 시스템이 복잡하고 비선형적인 방식으로 작동하며 많은 프로세스가 일반적으로 고전 통계에 나타나는 정규성 등의 가정에 따르지 않음을 점점 더 많이보고 있습니다. 유연성과 다양한 모델 가정으로 인해 기계 학습 접근 방식이 종종 더 강력한 모델로 이어질 것이라고 주장합니다.

"효과의 크기", "인과 관계"및 "한 변수가 결과에 영향을 미치는 정도"와 같은 문구로 구축 된 강력한 모델 가정이 있습니다. 경제와 같은 복잡한 시스템에서 이러한 가정은 가능한 시스템 상태의 특정 창 내에서만 유효합니다. 일부 관찰 가능 및 프로세스에서는이 창이 커서 비교적 견고한 모델이 될 수 있습니다. 다른 사람들에게는 작거나 비어있을 수 있습니다. 아마도 가장 큰 위험은 중간 단계 일 것입니다. 모델이 작동하는 것처럼 보일 수 있지만 시스템이 이동하면 갑자기 놀라운 방식으로 실패합니다.

기계 학습은 만병 통치약이 아닙니다. 오히려 나는 그것이 우리의 관측에서 의미를 얻는 새로운 방법을 찾는 것으로보고, 우리가 주변 세계에서 인식하기 시작하는 복잡성을 효과적으로 다루기 위해 필요한 새로운 패러다임을 찾는다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.