자동화 할 수없는 통계학자는 무엇을합니까?


26

소프트웨어는 결국 통계학자를 쓸모 없게 만들 것인가? 컴퓨터로 프로그래밍 할 수없는 것은 무엇입니까?


21
그들은 생각한다 (즉, 지식을 지니도록한다).
gung-복직 모니카

10
결과 해석 ;-)
ocram

5
같은 질문은 일반적으로 프로그래머를위한 질문 할 수 있습니다)
NB1

4
우리는 연구를 설계하며, 특히 통계적으로 "최상의"설계를 구현할 수없는 실제 문제를 처리해야합니다. 더티 데이터를 정리하여 실제 지식을 제공합니다. 또한 결과를 일반 [선택 언어 삽입]으로 해석합니다.
Michelle

13
맥주를 마시다! ; o)
Dikran Marsupial

답변:


28

@Adam, 기존의 방법론과 지식을 바탕으로하는 다른 분야의 사람들과 통계 연구자들을 유사하게 생각한다면 첫 번째 질문에 대한 대답이 '아니오'라는 것이 더 분명해질 것입니다.

통조림 소프트웨어 패키지를 단순히 적용하여 생계를 유지하는 통계학자는 결과를 해석해야하는 논문의 토론 섹션을 작성하는 것을 제외하고 모든 단계에서 컴퓨터로 대체 될 수 있습니다. 따라서, 그런 의미에서, 그것은 자동화 될 수 있습니다 (단, 자연어 프로세서의 하나의 지옥을 가진 복잡한 소프트웨어 일 필요가 있습니다).

그러나 대부분의 연구자들이 결국 알아 낸 것처럼 사람들이 자주 사용하는 "통조림"루틴은 매우 제한적이며 전문적인 연구 질문에 대답하기 위해 수정해야합니다 (또는 새로운 방법을 완전히 개발해야합니다). . 또는 연구원은 단순히 고전적인 방법을 사용하여 대답 할 수있는 다소 다르지만 관련이있는 연구 문제를 해결해야합니다.

내가 아는 대부분의 통계 학자들은 연구 방법 (예 : 교수, 연구 과학자)에서 새로운 방법론을 개발하는 것이 주된 역할을하는 분야에서 일하고 있습니다. 만약이 과정이 자동화 될 수 있다면, 컴퓨터가 유용한 새로운 방법론을 공식화하고 만들어 낼 수 있다면, 모든 분야의 연구원들이 쓸모 없게 될 것입니다.


2
두 번째 단락은 요점을 놓치고 있다고 생각합니다. 어려운 과정 (결과 해석)의 끝 일뿐 만 아니라 시작이기도합니다. 어떻게 데이터에 적용 할 방법을 이해하는 방법을 이해하십시오. 일반적인 경우 자연을 이해해야합니다. 데이터와 데이터의 출처.
Cascabel 2013

@Jefromi는 아래 사람에게 언급 한 것처럼 통계가 아니라 응용 분야의 전문가가 이해하는 것이라고 생각합니다.
매크로

응용 분야의 전문가들만 이해하면 내 일이 훨씬 쉬워지고 재미도 줄어 듭니다. 프레임 문제가 있습니다. 전문가가 생각하지 않는 것이 통계 분석에 중요 할 수 있다고 생각합니다. 실제로 가장 유익한 협업으로 전문가는 상당한 양의 통계를 배우고 통계학자는 응용 분야에 대해 상당한 양을 배우게됩니다.
Scortchi-Monica Monica 복원

33

강력한 AI가 인간을 완전히 쓸모 없게 만들면 컴퓨터는 통계학자를 쓸모 없게 만듭니다.

이 질문은 "이러한 강력한 통계 방법이 모두 있는데 왜 사람들은 여전히 ​​다른 방법을 사용합니까?"라는 질문을 떠올리게합니다. 대답 중 일부는 습관과 훈련이지만, 대부분의 질문은 순진한 것입니다. "견고하다"는 "질문에서 알 수 있듯이"내가하는 일에 대해 생각하고 이해할 필요가 없습니다 "를 의미하지는 않습니다.

내 말은, 오늘 R 통계 패키지를 다운로드하고해질 무렵에 기본적인 통계 기술을 수행 할 수 있다는 의미입니다. 그런 다음 몇 가지 패키지를 다운로드하고 난해한 방법을 사용하여 시작할 수 있습니다. 문제는 : 당신은 합리적인 답변을 얻을 것입니까? 대답은 아마도 아닐 것입니다.

알고리즘은 자동화되어 있지만 공격 계획에서 결과가 실제로 의미가 있는지에 대한 최종 판단에 이르기까지 조사 경로를 따라 많은 판단을 내려야합니다. 그 시점에 도달하기 위해, 당신은 "컴퓨터, 말해봐 ..."라고 말할 수있는 Star-Trek과 같은 컴퓨터에 대해 이야기하고 있습니다.


4
+1 "강한 AI가 인간을 완전히 쓸모 없게 만들면 컴퓨터는 통계학자를 쓸모 없게 만듭니다."
매크로

10

컴퓨터가 할 수없는 통계학자는 무엇을 할 수 있습니까? 교체 된 원래 프로그램을 작성하십시오.

다소 어리석은 대답 이외에도, 문제의 근본은 통계학에 유리한 통계 의 실제 과학 을 무시하고 통계 분석에서 창작 과정의 역할을 완전히 할인하는 것입니다. 이것은 Peter Flom의 자동차 예를 사용하는 것입니다. 자동차가 리벳과 용접을 사용하여 제작되었다는 말과 같이 로봇을 리벳 팅하고 용접하여 새로운 머스탱을 설계 할 수 없었습니다.

엄청난 양의 통계 작업에는 주제별 전문 지식, 판단 요청 및 창의력이 포함됩니다. 알고리즘에서 실행되는 "통조 된"분석은 종종 최상의 대답을 얻지 못하며 자동화 된 방법을 사용하면 실제로 잘못된 답을 얻거나 최소한 자신이 생각하는 답이 아닌 수많은 문서화 된 예가 있습니다. 순전히 수치 적으로 정의 된 Quantile을 기반으로 한 단계적 p- 값 기반 변수 선택 절차 및 분석의 사용은 내가 가장 잘 알고있는 두 가지이지만, 다른 많은 것을 찾을 수 있다고 확신합니다.

모든 것이 여전히 자동화 되었더라도 결과를 해석하는 문제가 있습니다. 회귀 계수 또는 p- 값을 얻을 때 통계 학자 (또는 통계적으로 기울어 진 과학자)의 작업은 수행되지 않습니다. 무엇을 그 발견 평균 . 경고는 무엇입니까? 이것은 이전의 상황에서 무엇을 나타 냅니까?

마지막으로 새로운 방법을 개발했습니다. 통계는 피셔, 콕스 등 피셔, 콕스 등 우리가 이름을 알고있는 사람들에 의해 단순히 오래 전에 마련된 것이 아닙니다. 진화하는 분야이며, 사람이 분석법 자체를 개발할 때까지 새로운 분석법을 컴퓨터에 프로그래밍 할 수 없습니다.


2
(+1) "알고리즘에서 실행되는 통조림 분석은 종종 최상의 답변을 얻지 못합니다"가 사실이기 때문에. 이것은 통계의 실무자들이 항상 이것을하지 않는 것을 의미하지는 않습니다. (참고 : 대부분의 통계 전문가는 통계학자가 아닙니다. 실제로 자신이하는 일을 알지 못해도 통계를 사용하는 사람들과 비슷합니다. 종종 나쁜 과학을 초래합니다)
Macro

10

이 문제를 해석하는 또 다른 방법은 "최근 몇 년간 자동화 된 통계 기술의 급속한 증가가 전담 통계 학자 및 데이터 분석가의 일자리 감소와 일치 했습니까?"

우리는 데이터를 보면서이 질문을 해결할 수 있습니다 데이터 분석 포지션을위한 직업 시장
여기에 이미지 설명을 입력하십시오

indeed.com 및 혁명 블로그 의 데이터 제공


+1 Indeed.com이 @cboettig obselete을 (를) 만들지 않았습니다.
Thomas Levine

4
"전용 통계 전문가 및 데이터 분석가의 직업 수요"가 구직 광고의 키워드 "데이터 과학자"또는 "빅 데이터"의 사용과 밀접한 상관 관계가 있다고 확신하지 않습니다. <- 가정의 의심이있는 것은 인간이 ;-) 테이블에 가져 오는 것입니다
대런 쿡

@DarrenCook 잘 말했다!
cboettig 2019

7

나는 그 질문의 전제에 전적으로 동의하지 않는다. 즉, 컴퓨터가 통계학자를 대체 할 수있는 방법이 없다고 생각하지만, 내가 왜 그렇게 생각하는지에 대한 구체적인 예를 제시 할 것이라고 생각한다.

통계 학자들이 과학자, 특히 실험의 설계와 해석에서하는 일은 인간의 마음뿐만 아니라 컴퓨터가 보여줄 수 없었던 철학적 구부러짐까지 요구합니다.

우리가 일종의 Skynet 유형 상황에 도달하지 않는 한, 물론 모든 인류의 미래에 이르기까지 모든 베팅이 아마 중단 될 것이라고 생각합니다. 통계 전문가에 대해서만 신경 쓰지 마십시오.


1
내가 고양이 대 군주에게 순종하는 것을 제외하고. :)
Michelle

5

이 질문은 통계 학자에 대한 순진한 견해를 제시합니다. ap <0.05인지 확인하고 일부 숫자와 표준 그래프를보고하는 것입니다. 이것이 통계학자가 의미하는 바라면 대부분 자동화 될 수 있다는 의미에서 옳습니다. 그러나 그것은 통계학자가 의미하는 것이 아닙니다.

통계 용어를 정의하면 더 나은 답변을 얻을 수 있습니다.


3

통계 패키지를 컴퓨터에로드한다고해서 자동차를 구입하는 것만으로도 통계학자가되는 것은 아닙니다.

통계학자가 "통조림"루틴을 적용하더라도 많은 질문이 있습니다.

  1. 어느 루틴? 고객의 질문에 어떤 루틴이 대답합니까?
  2. 어떤 변수로? 그리고 그들은 변형되어야 하는가? 일부 레벨을 결합해야합니까? 어떤 모델로 강제해야합니까?
  3. 어떤 데이터로? 이상 값을 삭제해야합니까? 다듬어? 아마도 강력한 방법일까요?

등등.

그러나 컴퓨터를 켜기 전에 작업이 시작되고 통계 패키지가 꺼진 후에도 끝납니다.

전 : 고객이하고 싶은 것은 무엇입니까? 종종 이것은 많은 일입니다! 클라이언트는 어떤 데이터를 가지고 있습니까? 어이! 변수는 V1-V828171로 표시됩니다. 어느 것입니까? 문헌의 상태는 무엇입니까? 고객은 무엇을 기대할 것입니까? 얼마나 기술적인가?

후 : 결과 무엇을 의미 합니까? (이것은 단지 "회귀가 중요하다는 것을 의미하는 것이 아니라") 결과는 어떻게 클라이언트에게 설명되어야 하는가? 결과가 다른 질문이 있습니까?

컴퓨터가이를 수행하기까지는 오랜 시간이 걸릴 것이라고 생각합니다.


1
(1), (2) 및 (3)에 나열된 질문에 대답하기 위해 몇 가지 논리적 프로세스를 거칩니다. 이론적으로이 논리적 프로세스는 컴퓨터 프로그램으로 코딩 될 수 있습니다. 컴퓨터에 완벽한 자연어 프로세서가 있고 소프트웨어에 모든 "통조림"소프트웨어가 포함되어 있고 위에서 언급 한 논리가 프로그래밍되어 있으면 이러한 작업을 수행 할 수 있습니다. 아니면 정확히 논리적 인 과정이 아닙니까?
매크로

4
저에게 비유는 "자동차를 구입한다고해서 기계공이나 자동차 디자이너가되는 것은 아닙니다."에 조금 더 가깝습니다.
추기경

1
@Macro 논리적 프로세스가 컴퓨터에 프로그래밍 할 수 있는지 여부를 의미하지는 않습니다. "일부 레벨을 결합해야합니까"는 항상 숫자 측정은 아닙니다. 예를 들어, 결합 된 레벨이 변수 자체와 관련하여 의미가 있는지 고려해야합니다.
Fomite

1
응용 프로그램의 맥락에서 그것이 의미가 있는지를 결정하는 것은 통계 전문가에게는 문제가 아닙니다. 응용 프로그램이 무엇이든 전문가에게는 문제입니다. 통계학자는 레벨이 균질 해 보이는지 여부에 따라 레벨을 결합하는 것이 정당한지 알 수 있는데, 이는 컴퓨터에 확실히 가르쳐 질 수 있습니다.
매크로

4
Google에서 자동차 구입하면 운전할 수있는 방향으로 크게 발전했다고 지적 할 수는 없습니다 . 자동으로 그렇게 할 것입니다!
whuber

2

다른 직종 또는 작업의 자동화 가능성을 살펴 보는 학문적 연구는 통계학자가 곧 컴퓨터로 대체 될 것이라고 생각하지 않습니다. 예를 들어 컴퓨터 화 확률에 따라 직업 순위를 매기 는 논란이 많은 Frey & Osborne (2013) 연구를 참조하십시오 . 통계학자는 702 명 중 213 명 중 22 %의 확률로 213 명으로 순위가 높습니다 (부록의 표 참조). 더 관심이 있으시면 여기 슬레이트 기사참조하십시오 .

Arntz et al. (2016) ( 여기 이코노미스트 기사) 유럽 연합 (EU)에 대한 작업보다는 직업의 모양과 유사한 결론에 도달 : "복잡한 수학이나 통계"이렇게이 통계적으로 유의하게 음의 작업 automatibilty 관련이있다 (표 3 참조).

그러나 일부주의 학자 및 / 또는 경제학자들은 항상 미래를 예측하는데 매우 좋은하지 한 것이 좋습니다 (노벨상 수상자 인 로버트 루카스 2003 년에 체결 예를 들어, 몇 년 금융 위기 이전에, 그 우울증 예방의 "중앙 문제로 모든 실질적인 목적으로 해결되었으며 실제로 수십 년 동안 해결되었습니다. " ). 두 연구는 실무 논문으로 보이며, 광범위하게 논의되었지만 표준 동료 검토 저널에는 출판되지 않았습니다.

학문적 논쟁에 관해서는, 여기 당신은 자동화에 대한 연구의 상태에 대한 개요 기사를 찾을 수 있습니다.


0

AI가 통계 전문가를 더 똑똑하고 경쟁력있게 만들 것이라고 생각합니다. 왜? 이것은 수십 년 전에 그들의 개념 이후 인공 지능의 의도이기 때문에 ...

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.