민간 부문 통계학자는 인과 관계를 결정하려고 노력합니까?


12

학계 경제학자들은 종종 인과 관계를 결정하는 데 관심이 있습니다. 내가 듣는 모든 민간 부문 통계 / 데이터 과학 직업은 단지 예측 모델만을 찾고있는 것 같습니다.

민간 부문 (또는 정부 일자리)에 인과 관계를 연구하는 일자리가 있습니까?


5
우리가 개입하기를 원할 때마다, 당신은 우리가 걱정하는 내기를합니다. 간단한 디자인 변경을 위해 Google이 수행하는 모든 A / B 테스트에 대해 생각해보십시오.
Matthew Drury

8
물론이야. 거의 모든 법적 소송은 인과 관계 문제에 달려 있습니다. 거의 모든 적절한 품질 관리 체계는 인과 관계와 관련이 있습니다. 엔지니어와 과학자들은 그것에 대해 많은 관심을 가지고 있습니다.
whuber

6
또 다른 고전적인 민간 부문 질문은 "내 광고 더 많은 판매를 유발 합니까?"입니다.
Matthew Gunn

2
@ 매튜 건 : +1 일반적으로 : "(비용이 많이 드는) 변경으로 인해 차이가 발생합니까?" 비즈니스가 시장의 인과 적 역학에 대한 어느 정도의 이해를 가지고있는 상태로 남아 있어야하고 번성해야한다고 가정하는 것이 중요합니다.
usεr11852

4
처음에는이 스레드를 CW로 변환하지 말고 권위있는 데이터 / 사실 기반 답변이 제공 될 수 있다고 생각했습니다. 많은 사람들이 흥미롭고 유용하다고 생각할 수있는 여러 가지 이유 때문에 CWM으로 변환했습니다. 당신의 기여에 감사합니다!
whuber

답변:


15

나는 관찰 또는 결함이있는 실험 데이터로 인과 추론을 수행하는 기술의 경제학자입니다. 대부분의 주요 기술 회사는 가격 책정, 마케팅 및 제품 설계에 대한 응용 연구를 수행하는 데 저와 같은 사람들이 있습니다. 일부 회사에는 공공 정책 팀도 있습니다.

웹 실험을하는 사람들도 많이 있습니다. 이것은 훨씬 더 큰 그룹입니다.

마지막으로, 특정 유형의 경제 컨설팅, 특히 독점 금지 (anti-trust)가 주요 초점입니다.


7

[처음 다섯 감정 답변이 검열되었습니다.]

그것은 사이트에서 가장 이상한 질문 중 하나입니다. 그리고 교수님의 말과 실제 생활, 즉 상아탑 외부의 생활 사이에 얼마나 많은 분리가 있는지 보여줍니다. 엿보는 것이 좋지만 ... (경제학 박사 과정 학생)은 더 자주해야합니다.

그렇습니다. 학계 밖에서는 사람들 (놀람, 놀라움)이 인과 추론 방법을 사용하는 직업이 있습니다. 그리고 (놀랍고 놀랍게도) 논문을 출판하십시오. 제 답변은 미국마다 다르지만 다른 국가에서도 유사한 조직을 찾을 수 있습니다.

  • 예제 1 (내 업무에서 내부적으로 익숙하기 때문에). 저는 Abt Associates 의 대형 계약 연구 기관의 자회사에서 근무하고 있습니다. 50 개국에서 약 2,300 명을 고용하고 있으며, 대부분은 평가 연구를 수행하거나 지원하고 중재를 시행하는 일을합니다. Jacob Klerman 은 상위 6 명의 기술 담당자 ( Senior Fellows 라고도 함) 중 하나가 평가 검토 의 편집자입니다., 약 5/6 정도의 학계가있는 편집자들을 감독합니다. 이것이 민간 부문의 예입니다. (회사 위치 광고를 확인하여 회사에서 어떤 종류의 기술을 찾고 있는지 구체적으로 알 수 있습니다. 모든 사람들이 JOE에 비싼 광고라고 광고하는 것은 확실하지 않습니다. 미국에서 행복 할 다른 12 명을 쉽게 지명 할 수 있습니다. 장인 경제학자를 고용하기 위해.)
  • 예 2 (다른 장소에서이 프로젝트를 시작한 사람들을 알고 있기 때문에 나는 그것에 대해 잘 알고 있습니다) : What Works Clearinghouse미국 연방 교육부 (Department of Education)는 공개 된 교육 프로그램 분석에 대한 메타 분석 전용 웹 사이트입니다. WWC는 인과 적 주장을 뒷받침하기에 충분히 엄격한 연구로 간주되는 것과 그렇지 않은 것에 대한 구체적인 지시를받은 검토 자 네트워크를 통해 운영됩니다. 그 출판 된 연구의 대부분은 절대 쓰레기라고 밝혀졌습니다. 마찬가지로 헛소리. 컨트롤 그룹이 없습니다. 인구 통계 학적 공변량 / 기준선 동등성에 대한 잔액을 확인하지 않습니다. 연구의 약 3-5 % (좋은 평가를 위해 동료 검토 문헌에 발표)는 "예약없이 표준을 충족"합니다. 즉, 실험군의 무작위 배정, 통제 된 마멸 및 교차 오염과 유사합니다. 분석을 다소 수용 가능한 방식으로 진행했습니다. (베이 즈 정리로 "씹는 껌이 수학 성취도를 높인다는 내용의 출판물을 보았다"는 말을들을 때, "BS"라고 대답 할 수 있으며, 시간의 90 % 이상이 될 것입니다.) 어쨌든 이것은 연방입니다 정부 기관에서 인과 추론 도구의 적절한 사용을 검토하는 사례입니다. (연구 검토 자로서 당신의 이름을 모자에 던지면, 이것은 당신에게 훌륭한 교육 경험이 될 것입니다. 프로그램 평가를 가르치고 있다면, 이것을 학생들에게 요구 사항으로 만들었을 것입니다.) (FDA를 사용하는 생물 통계학 자의 경우, 데이터를 수집하기 전에 분석 코드를 제출해야합니다. WWC 표준은 여전히 ​​매우 느슨합니다.) d) 시간의 90 % 이상이어야합니다.) 여하튼, 이것은 연방 부서 프로젝트이므로 정부 기관이 인과 추론 도구의 적절한 사용을 검토하는 경우에 대한 예입니다. (연구 검토 자로서 당신의 이름을 모자에 던지면, 이것은 당신에게 훌륭한 교육 경험이 될 것입니다. 프로그램 평가를 가르치고 있다면, 이것을 학생들에게 요구 사항으로 만들었을 것입니다.) (FDA를 사용하는 생물 통계학 자의 경우, 데이터를 수집하기 전에 분석 코드를 제출해야합니다. WWC 표준은 여전히 ​​매우 느슨합니다.) d) 시간의 90 % 이상이어야합니다.) 여하튼, 이것은 연방 부서 프로젝트이므로 정부 기관이 인과 추론 도구의 적절한 사용을 검토하는 경우에 대한 예입니다. (연구 검토 자로서 당신의 이름을 모자에 던지면, 이것은 당신에게 훌륭한 교육 경험이 될 것입니다. 프로그램 평가를 가르치고 있다면, 이것을 학생들에게 요구 사항으로 만들었을 것입니다.) (FDA를 사용하는 생물 통계학 자의 경우, 데이터를 수집하기 전에 분석 코드를 제출해야합니다. WWC 표준은 여전히 ​​매우 느슨합니다.)

경제학 교수들은 실제로 인과 방법을 사용하지 않는다고 말하지 않는다고 생각합니다 (아무도 "아무도 신경 쓰지 않을 통계 방법은 없습니다"). 그러나 학생은 인과 추론이 단지 상아라고 우려하고 있습니다. 타워 토픽 (로그 오목 밀도 추정과 같은 : 업계에서 아무도 그런 일하지 않는다고 확신합니다 ). 사례 2에서 인과 관계 방법을 사용하는 업계의 사람들을 어떻게 보여주는지도 명확하지 않습니까?
Cliff AB

@CliffAB OP는 산업 및 정부 사례를 요구하므로 # 2가이 법안에 부합합니다. 필자는 경제학 박사 과정 학생들 사이에서 상아탑 밖에서의 삶에 대한 미미한 지식에 대한 StasK의 요점과 교수는 덜 정확하다고 생각하지만, 분야와 부서, 심지어는 시간이 지남에 따라 많은 이질성이 있습니다.
Dimitriy V. Masterov

@ DimitriyV.Masterov : # 2는 적절한 인과 도구를 사용 하지 않는 예입니다 . 그리고 StasK의 답변을 교수들이 "외국인 중 누구도 인과 방법을 사용하지 않는다"고 말하는 것을 암시합니다. 인과 방법을 전문으로하는 교수가 이것을 말했다면, 그들은 실패를 인정하고있다. 학계 이외의 어느 누구도 사용하지 않는 통계적 방법을 적용한다면 좋은 것으로 간주되지 않습니다. 통계 이론은 물론 다른 이야기입니다.
Cliff AB

OP의 질문에 대한 나의 독서 (다시, 오해의 소지가 있음)는 교수들이 그들에게 "인과 적 통계가 중요하다!"고 말하고 그들의 반응은 "정말 중요합니까? 실제로 산업계 사람들이이 방법들을 사용합니까?"라고 말합니다. 그러나 다시, 나는 아마 오해하고 있을지도 모른다.
Cliff AB

1
@CLIFF WWCH는 학계 연구를 검토하여 인과 적 추론까지 밀과 겨를 분리합니다. 따라서 실제로 정부의 일부 지역보다 표준이 높은 지역의 훌륭한 예입니다.
Dimitriy V. Masterov 2016

6

제약 통계 및 여러 관련 분야에서 중재와 건강 결과 사이의 인과 관계는 중재의 사용 여부를 결정할 때 중요한 관심 대상입니다. 무작위 시험 (임상 또는 전임상), 비 무작위 또는 단일 암 시험, 실험실 실험, 메타 분석, 이상 반응의 자발적보고를 기반으로 한 약물 안전성 감시, 역학 (예 : 역학 포함)과 같은 광범위한 하위 분야가 있습니다 만 델리 안 무작위 배정과 같은 아이디어 및 효과 연구 (예 : 보험 청구 데이터베이스와 같은 관측 데이터 사용). 물론 인과 관계를 유발하는 고안된 무작위 실험 (예 : 무작위 임상 시험)에서 일부 다른 응용 프로그램보다 다소 쉽습니다.


나는 의약 개발 환경이 사람들이 더 나은지 아닌 오히려 더 나은 사람의 원인에 관심을 갖는 소수의 장소 중 하나라고 생각합니다. 궁극적으로 당신은 전체 인구에서 '안전'해야하기 때문입니다. -확실히, 좋은 대답이지만, 언급했듯이 아주 특별한 경우입니다.
Dennis Jaheruddin

4

저는 미국 최대의 노인 생활 추천 서비스 인 A Place for Mom의 연구원입니다. 우리는 생활 보조 커뮤니티로 이사하는 것이 삶의 질에 어떤 영향을 미치는지 이해하기위한 설문 조사를 설계했습니다. 인과 추론은이 연구의 중심이며, 인과 분석 방법 (예 : 매칭, 모델링 선택 프로세스, 평균 치료 효과 추정)이 필수적입니다.


-3

대부분의 민간 부문 상황에서 인과 관계는 중요하지 않습니다

실제로, 전형적인 언어 사용에도 불구하고 사람들은 (잘 이해 된) 인과 관계보다는 잘 이해 된 영향 에 훨씬 더 관심이 있습니다 .

학문적 관점에서 볼 때 매우 흥미 롭습니다.

내가 A를하면 그 결과는 B가됩니다

그러나 실제 관점에서 볼 때 거의 모든 상황에서 사람들이 실제로 알고 싶어하는 것은 다음과 같습니다.

내가 A를하면 결과는 B가됩니다

물론 A의 영향에 관심이있을 수 있지만, 이것이 실제로 원인인지, 아니면이 상관 관계를 생성하기 위해 발생하는 숨겨진 원인이 있는지는 일반적으로 그다지 흥미롭지 않습니다.

제한 사항에 대한 참고 사항

당신은 생각할지도 모릅니다. 그러나 우리가 A가 B를 유발한다는 것을 모른다면, 그 가정을 수행하는 것은 매우 위험합니다.

이것은 어떤 방식 으로든 사실이지만 다시 실제로 걱정할 것입니다. 작동합니까, 아니면 예외입니까?

이를 설명하기 위해이 상황에 유의하십시오.

내가 A를 수행하면 상황 X에서 A로 인해 결과가 B가되고 X로 인해 결과가 델타에 의해 벗어날 수 있습니다.

이 상황보다 훨씬 도움이되지 않습니다 (영향을 동일하게 정량화 할 수 있다고 가정).

내가 A를한다면, 상황 X에서 결과는 B가되고 결과는 델타에 의해 벗어날 것이다

간단한 예 : 상관 관계

  • A : 엔진 오일 보충
  • B : 브레이크 고장 감소
  • C : 자동차 점검

논리 : C는 항상 A와 B를 유발합니다

결과 관계 : A가 올라가면 B가 올라가지 만 A와 B 사이에는 인과 관계가 없습니다.

요점 : A가 B에 미치는 영향을 모델링 할 수 있습니다. A는 B를 유발하지 않지만 모델은 여전히 ​​정확하지만 A에 대한 정보가 있으면 B에 대한 정보를 갖게됩니다.

브레이크 페일 루어에 관심이있는 사람은 A에 관한 정보를 가지고 A와 B의 관계를 아는 것에 관심을 가질 것이며,이 관계가 인과 관계가 있는지 여부에 관계없이 관계가 올바른지 여부 만 관심을 가질 것입니다.


1
"원인"과 "충격"의 차이로 혼란스러워하는 유일한 사람이라고 생각하지 않습니다. 귀하의 예는 약간 명확하게 보이는 것처럼 보입니다. 인과 관계의 세부 사항을 선택 취소하는 것은 특별히 중요하지 않을 수 있습니다. 클릭당 비용 (CPC) 광고를 더 많이 구매 하면 판매가 증가 할 것입니다. 어떻게하는지 신경 쓰지 마십시오. 이것이 고객에게 중요합니다.
Scortchi-Monica Monica 복원

@Scortchi 원인이 의미하는 바 : 'A이면 B 때문입니다.' 내가 의미하는 바의 영향 (아마도 가장 일반적인 정의는 아니지만 언어에 관한 것이 아님) : 'If A then B'. -관련 차이점의 교과서 예 : C는 A와 B를 유발합니다. 따라서 A는 B를 유발하지 않지만 A가 B에 미치는 영향을 모델링하는 것이 합리적이라고 말하고 싶습니다. '는 시차와의 실제 관계'로 대체 될 수 있습니다.
데니스 Jaheruddin

5
광고 예에 동의하지 않는다고 생각합니다. 더 많은 온라인 광고를 구매할지 여부를 결정해야하는 경우 더 많은 클릭 연결 또는 기타 광고를 통해 구매하지 않는 것보다 더 많은 판매가 발생하는지에 대해 관심이 있습니다. 작년에 온라인 광고를 증가시킨 회사가 그렇지 않은 회사보다 판매 증가율이 높은지 여부와는 다른 의미 일 수 있습니다. 인과 관계는 결과가 발생하는 정확한 방법에 대한 것이 아니라 (물론 알기 좋을 것임) 오히려 A를 수행하거나 수행하지 않아서 어떤 일이 발생하는지에 대한 것입니다.
Björn

6
영업에서는 인과 관계 를 고려해야 합니다. 조치 뒤에 결과 가 있지만 실험 결과가 원인이 아닌 실험을 수행하는 경우 , 자연 스러우면서도 희망이있는 것처럼 나중에 조치 를 반복 할 때 실망 할 것입니다. 일관성이 없다면 (만약 있다면) 가 뒤 따릅니다 . 요컨대,이 답변에 사용 된 "원인"과 "충격"의 차이는 "통계적으로 유의 한"- "신뢰할만한 가치와 미래 행동의 기초"-와 "스퓨리어스"로 해석되는 것과 유사하게 보입니다. " B A BABAB
whuber

나는이 의견에 동의하지 않는다고 생각하지만, 내 경험상 그것은 많은 문제에서 비록 인과 관계가 추구되지는 않지만 어느 정도의 인과 관계가 요구된다는 것입니다. 실제로, 나는 이것이 예측 모델과 설명 모델의 구별과 거의 동등한 것으로 본다.
Thomas Speidel
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.