수학자는 품질 통계 학위와 동등한 지식을 원합니다


77

나는 사람들이 복제본을 닫는 것을 좋아하므로 통계 학습 을 시작 하기위한 참조를 요구 하지 않습니다 ( here ).

나는 수학 박사 학위를 받았지만 통계를 배우지 못했습니다. 최고 수준의 BS 통계학 학위에 대한 동등한 지식으로의 최단 경로는 무엇이며 어떻게 달성했는지 측정하는 방법은 무엇입니까?

책 목록만으로도 충분하다면 (내가 운동을한다고 가정하면) 훌륭합니다. 예, 문제를 해결하는 것이 암시적인 학습의 일부가 될 것으로 기대하지만 실제로 가능한 한 빨리 추적하고 싶습니다. 통계학 전공이 일반적으로 배우는 것의 일부가 아니라면 나는 엄청나게 엄격한 치료를 찾고 있지 않습니다.


1
박사 학위를받은 수학 분야는 무엇입니까? 관련이있을 수 있습니다.
mpiktas

7
통계를 배우고 싶은 이유 를 우리와 공유 할 수 있습니까? 호기심? 프로젝트 나 연구가 필요하십니까? 직업을 바꾸고 싶습니까? 일부 과정을 가르쳐야합니까? 이론가로서 통계 학자와 협력하고 싶습니까?
whuber

5
도메인 별 전문 지식도 개발하는 것이 거의 항상 중요하다고 생각합니다. 많은 통계가 특정 분야와 관련된 모델을 배우고 있습니다.
Tristan

10
"통계학자가 양질의 수학 학위와 동등한 지식을 원합니다"를 되 돌리십시오. 빠른 경로는 없을 것입니다.
확률

1
"저는 사람들이 복제본을 닫는 것을 좋아한다는 것을 알고 있습니다."
Mustafa S Eisa

답변:


77

(매우) 단편

간단히 말해서, 어떤 의미에서 통계는 다른 기술 분야와 같습니다 . 빠른 트랙이 없습니다 .

긴 이야기

통계학 학사 학위 프로그램은 미국에서 비교적 드문 경우 이것이 사실이라고 생각하는 한 가지 이유는 통계학을 배우는 데 필요한 모든 것을 학부 커리큘럼에 포함시키기가 매우 어렵다는 것입니다. 이것은 상당한 일반 교육 요건이있는 대학에서 특히 중요합니다.

필요한 기술 (수학적, 계산 및 직관적)을 개발하려면 많은 노력과 시간이 필요합니다. 일단 학생이 미적분학과 상당한 양의 선형 및 행렬 대수를 숙달하면 통계는 상당히 적절한 "작동"수준에서 이해되기 시작할 수 있습니다. 그러나 응용 통계학자는 쿠키 커터 또는 레시피 기반 통계에 대한 접근 방식을 따르지 않는 영역에서 자신을 찾기가 매우 쉽다는 것을 알고 있습니다. 표면 아래에서 일어나는 일을 실제로 이해하려면 전제 조건이 필요합니다.오늘날의 세계에서 수학과 후반의 학부 훈련에서만 얻을 수있는 전산 성숙도. 이것이 사실 통계 훈련이 미국의 MS 수준에서 주로 시작하는 이유 중 하나입니다 (인도, ISI 전담은 약간 다른 이야기입니다. 일부 캐나다 기반 교육에 대해서도 비슷한 주장이있을 수 있습니다. 정보에 근거를 둔 유럽 기반 또는 러시아 기반 학부 통계 교육.)

거의 모든 (흥미로운) 직업은 MS 수준의 교육을 필요로 할 것이고, 정말로 흥미로운 (제 생각에는) 직업은 본질적으로 박사 수준의 교육을 요구합니다.

수학 박사 학위를 받았을 때 어떤 분야를 알지 못하지만 MS 수준의 교육에 더 가까운 것에 대한 제 제안은 다음과 같습니다. 선택 사항을 설명하기 위해 몇 가지 괄호가 있습니다.

  1. D. 허프, 통계와 거짓말하는 법 . (매우 빠르고 쉽게 읽을 수 있습니다. 특히 평신도에게 통계를 제시 할 때 많은 개념적 아이디어와 함정을 보여줍니다.)
  2. Mood, Graybill 및 Boes, 1974 년 3 월 3 일 통계 이론 소개 . (이론적 통계에 대한 MS 수준의 소개. 고전적이고 빈번한 틀에서 샘플링 분포, 점 추정 및 가설 검정에 대해 배우게됩니다. 의견은 이것이 Casella & Berger 또는 Rice와 같은 현대의 제품보다 일반적으로 더 우수하고 약간 더 진보적이라는 것입니다.)
  3. Seber & Lee, 선형 회귀 분석 , 2 차 (적용된 통계에서 이해해야 할 가장 중요한 주제 인 선형 모델에 대한 포인트 추정 및 가설 검정 이론을 제시합니다. 아마도 선형 대수 배경이 우수 할 것이므로 기하학적으로 진행되는 상황을 즉시 이해할 수 있어야합니다. 모델 선택, 가정에서 벗어남, 예측 및 강력한 선형 모델 버전의 평가 문제와 관련된 유용한 정보도 제공합니다.)
  4. Hastie, Tibshirani 및 Friedman, 통계 학습의 요소 , 2nd ed., 2009. (이 책은 마지막 것보다 훨씬 더 많은 감정을 가졌으며 많은 현대 기계 학습 주제를 다룹니다. 여기서 중요한 기여는 통계 해석을 제공하는 것입니다. 특히 모델에 불확실성을 정량화에 떨어져 지불 많은 기계 학습 아이디어,의. 이것은 유엔 (데르) 일반 기계 학습 책에서 다루어 이동합니다. 무료로 합법적으로 사용할 수 경향이 뭔가 여기에 .)
  5. A. Agresti, 범주 형 데이터 분석 , 2 차 개정판. (통계 프레임 워크에서 불연속 데이터를 처리하는 방법에 대한 훌륭한 프레젠테이션. 좋은 이론과 실제 사례. 아마도 어떤면에서는 전통적인 측면 일 것입니다.)
  6. Boyd & Vandenberghe, 볼록 최적화 . (가장 인기있는 현대 통계 추정 및 가설 검증 문제는 볼록 최적화 문제로 공식화 될 수 있습니다. 이는 SVM과 같은 수많은 기계 학습 기술에도 적용됩니다. 제 생각에는 아주 귀중 합니다 . 여기서 합법적으로 무료로 이용할 수 있습니다 .)
  7. Efron & Tibshirani, 부트 스트랩 소개 . (최소한의 부트 스트랩 및 관련 기술에 익숙해야합니다. 교과서의 경우 빠르고 쉽게 읽을 수 있습니다.)
  8. J. Liu, 과학 컴퓨팅의 Monte Carlo 전략 또는 금융 공학의 Monte Carlo 방법 인 P. Glasserman . (후자는 특정 응용 분야와 관련이 있지만, 가장 중요한 모든 기술에 대한 좋은 개요와 실제적인 예를 제공 할 것이라고 생각합니다. 금융 공학 응용 프로그램은 지난 10여 년 동안 상당한 양의 Monte Carlo 연구를 주도했습니다. .)
  9. E. Tufte, 정량적 정보의 시각적 표시 . (통계 전문가들조차도 데이터의 우수한 시각화 및 표현은 과소 평가되었습니다.)
  10. J. Tukey, 탐색 적 데이터 분석 . (표준. Oldie이지만 goodie. 일부는 구식이라고 할 수도 있지만 여전히 살펴볼 가치가 있습니다.)

보완

여기에 약간 더 진보적이고 이론적이거나 보조적인 성격을 가진 다른 책들이 있습니다.

  1. FA Graybill, 선형 모형의 이론 및 응용 . (구식, 끔찍한 조판이지만 Seber & Lee의 모든 동일한 근거 등을 다루고 있습니다. 더 현대적인 치료법은 아마도 SVD를 사용하여 많은 기술과 증거를 통합하고 단순화하는 경향이 있기 때문에 구식이라고 말합니다.)
  2. FA Graybill, 통계 응용 프로그램이 포함 된 행렬 . (위의 컴패니언 텍스트. 여기에는 통계에 유용한 훌륭한 행렬 대수 결과가 풍부합니다. 훌륭한 책상 참조.)
  3. Devroye, Gyorfi 및 패턴 인식의 확률론 인 Lugosi . (분류 문제에서 성능을 정량화하는 것에 대한 엄격하고 이론적 인 텍스트)
  4. Brockwell & Davis, 시계열 : 이론 및 방법 . (클래식 시계열 분석. 이론적 처리. 더 많은 것들을 위해 Box, Jenkins & Reinsel 또는 Ruey Tsay의 텍스트는 괜찮습니다.)
  5. Motwani와 Raghavan, 무작위 알고리즘 . (계산 알고리즘에 대한 확률 적 방법 및 분석)
  6. D. Williams, 확률 및 Martingales 및 / 또는 R. Durrett, 확률 : 이론 및 예 . (DL Cohn 수준에서 측정 이론을 보았지만 확률 이론이 아닐 수도 있습니다. 이미 측정 이론을 알고 있다면 둘 다 빠르게 속도를내는 데 좋습니다.)
  7. F. Harrell, 회귀 모델링 전략 . ( ESL ( 요소 통계 학습) 만큼 좋지는 않지만, 다른 흥미롭고 흥미로운 것들이 있습니다. ESL보다 더 많은 "전통적인"응용 통계 주제를 다루므로 확실히 알고 있어야합니다.

보다 고급 (의사 수준) 텍스트

  1. Lehmann and Casella, 포인트 추정 이론 . (PhD 수준의 포인트 추정 처리.이 책의 과제 중 하나는이 책을 읽고 오타가 무엇인지 아닌지를 파악하는 것입니다. 빠르게 인식하고 있다는 것을 알면 이해하게 될 것입니다. 연습이 많이 있습니다. 이 문제는 특히 문제에 빠질 경우 특히 유용합니다.)

  2. 통계적 가설을 테스트하는 Lehmann and Romano . (가설 테스트의 박사 수준 치료. 위의 TPE만큼 오타가 아닙니다.)

  3. A. van der Vaart, 점근 통계 . (응용 분야에 대한 힌트가 좋은 통계 점근 법 이론에 대한 아름다운 책. 적용되는 책은 아닙니다. 나의 유일한 퀴즈는 다소 기괴한 표기법이 사용되고 때로는 세부 사항이 깔개 아래에 솔질되어 있다는 것입니다.)


1
@ 기독교, 전 소비에트 대학은 별도의 학부 통계 연구를합니다. 예를 들어 빌니우스 대학교에서는 통계학 학사 학위를 취득 할 수 있습니다. 학생들과 함께 보는 것에서 저는 흥미로운 직업에 석사 또는 박사 수준의 교육이 필요하다는 것에 진심으로 동의합니다.
mpiktas

1
@cardinal, 박사 과정에서 MS + 4 년 만에 2 yearts 흥미로운 무언가를 배울 수 십년하게 + BS 4 년 @mpiktas : 나는 줄 것이다 이 위대한 대답 가능한 경우에. 대부분의 책은 나에게 새로운 책입니다. +
Dmitrij Celov

2
@ 존 살바 티어, 당신은이 방법에서 다루지 않는 것이 맞습니다. 다시 말하지만, 특히 텍스트의 주요 초점이 알고리즘에 있지 않기 때문에 이것은 더욱 맛의 문제입니다. 다시 말해, 서론 (13 페이지)에서 저자가 귀하의 우려를 직접 해결합니다.
추기경

2
@cardinal : 스칸디나비아 대학교는 보통 학사 학위를 제공합니다. 그러나 통계 학자들은 스스로를 너무 심각하게 생각합니다. "흥미로운"직업을 얻기 위해서는 박사 학위가 필요하다는 것에 동의하지 않습니다. 과학과 연구가 점점 더 많은 학제 간 통계가 여러 분야의 연구에 부과되었다고 생각합니다. 고 영향도 저널에 실린 기사의 절반은 문제의 원래 맥락 / 도메인에서 주어진 의미가 없을지라도 요구를 충족시키기 위해 의심스러운 통계 분석을 가지고 있습니다.
posdef

1
@cardinal Mood book은 요즘 수학 배경을 가진 사람에게 충분히 공식적인 통계에 대한 소개 책을 찾기가 어렵 기 때문에 큰 제안이었습니다. 이 책을 읽은 사람이 있습니까? Panateros, "수학자에 대한 통계" springer.com/us/book/9783319283395
이고르 Fobia

11

좀 더 엄격한 학교에 대해서는 말할 수 없지만 Davis 대학의 University of General 통계 (학교에서 가장 엄격한) 학사 학위를 받고 있으며 엄격함과 파생에 대한 의존도가 상당히 높습니다. 실제 분석 및 선형 대수학-통계에 유용한 기술에 대한 매우 강력한 배경 지식을 가지고 있기 때문에 수학 박사 학위가 도움이 될 것입니다. 저의 통계 프로그램은 기본 과정 (선형 대수, 실제 분석, 미적분, 확률, 추정)을 지원하는 코스워크의 약 50 %를 가지고 있으며 나머지 50 %는 기본 (비모수, 계산, 분산 분석 / 회귀, 시계열, 베이지안 분석).
기본을 익힌 후에는 구체적으로 건너 뛰는 것이 그리 어렵지 않습니다. 수업 시간에 대부분의 개인은 증거와 실제 분석에 어려움을 겪고 통계 개념을 쉽게 파악하므로 수학 배경에서 오는 것이 가장 도움이 될 것입니다. 즉, 다음 두 텍스트는 통계에서 다루는 많은 주제를 잘 다루고 있습니다. 그건 그렇고 당신이 제공 한 링크에서 두 가지 모두를 권장 했으므로 귀하의 질문과 귀하가 연결 한 질문은 반드시 서로 관련이 없다고 말할 수는 없습니다.

Harald Cramer 의 수학적 통계 방법

모든 통계 : 통계 추론의 간결한 과정 , Larry Wasserman


3
+1 모든 통계 : 시작하기에 좋은 장소입니다.
Simon Byrne

1
UC-Davis 프로그램은 좋아 보이고 거기서 훌륭한 교육을받을 것입니다. 나는 다른 곳보다 덜 엄격하다고 생각하지 않을 것입니다. "통합 BS / MS 학위" 페이지 에 대한 의견 은 흥미롭고 스레드와 관련이 있다고 생각했습니다 . "통계 학자에 대한 수요가 많지만 통계학 학사 학위를 가진 사람들이 달성 한 지식과 기술은 종종 충분하지 않습니다. [정부 또는 산업] 직장에서의 요구. "
추기경

9

영국의 왕립 통계 협회 (Royal Statistical Society)는 학사 학위 수준의 통계 대학원 디플로마를 제공합니다. 강의 계획서, 독서 목록 및 과거 논문은 웹 사이트 에서 구할 수 있습니다 . 나는 수학자들이 통계에서 속도를 높이기 위해 그것을 사용한다는 것을 알고 있습니다. 시험을 치르는 것은 (공식적으로 또는 자신이 편한 시간에 편한 시간에) 시험 시간을 측정하는 유용한 방법이 될 수 있습니다.


3
대학원 디플로마 시험은 사실상 마지막 해 학부 시험입니다. "스테이징"목적을 위해 먼저 취할 수있는 하위 레벨 인증서가 있습니다. RSS 시험은 홍콩을 제외하고 전 세계적으로 올바르게 기억할 수 있습니다 (홍보는 자체 통계 사회 및 시험이 있음). 대안은 영국의 Open University에서 원격 학습을 통해 제공되는 학부 통계학 학위입니다. 이것은 RSS Grad Dip보다 약간 낮은 수준이므로 준비 할 수 있습니다. 교육 과정 으로서는 훨씬 더 비쌉니다.
Silverfish

5

저는 최고 통계 학교의 커리큘럼 웹 사이트를 방문하고, 학부 과정에서 사용하는 책을 기록하고, 아마존에서 높은 평가를받은 책을 확인한 후 공공 / 대학 도서관에서 주문하십시오.

고려해야 할 일부 학교 :

MIT OCW 및 videolectures.net과 같은 다양한 강의 비디오 사이트로 텍스트를 보충하십시오.

Caltech은 학부 학위가 없지만 학부 과정 통계 과정을 따라도 잘못되지는 않습니다.


1
이것은 약간 이상한 목록처럼 보입니다. 내 지식으로는 Carnegie Mellon은 (공식적으로) 통계 학부 학위를 제공하는 유일한 학교입니다. Caltech이나 MIT도 통계학 대학원 프로그램을 가지고 있지 않습니다.
추기경

@추기경. 왜 나를 의심해야합니까? :) 나는 그 훌륭한 기관의 학부 통계 과정과 연결했습니다. 또한 최고의 학교의 믹싱 및 매칭 과정은 더 나쁜 학교의 학위 과정을 따라 이길 것입니다.
Neil McGuigan

2
OCW는 확실히 훌륭한 자원이며 훌륭한 이니셔티브입니다. 이것은 의심의 여지가 없습니다. "최고의 학교"에서 혼합하고 매칭하는 것이 탁월한 솔루션이라는 주장은 특히 학부 연구에서 매우 의심 스럽다. 동기가 높은 학생은 어느 학교에서나 우수한 학부 교육을 받아야하지만, 많은 "더 열악한"학교에서는 학부 교육이 우수하거나 더 나아질 수 있습니다. 당신이 열거 한 학교와 같은 학교는 대학원 교육을 위해 "승리"하는 경향이 있습니다.
추기경

2
실제로 이것은 내가 시도한 첫 번째 일이었습니다. 나는 질문을 게시하기 전에 이것을 시도했다. 강좌 목록을 찾는 것은 어렵지 않지만 실제로 해당 강좌에 사용 된 책과 해당 책의 어떤 섹션에 대한 정보를 찾는 것이 훨씬 더 어렵습니다.
John Robertson

3

나는 Silvey에 의한 통계적 추론을 보았는데, 약간의 일시적인 통계 파악이 필요한 수학자들이 사용했다. 이 책은 작은 책이므로 권리가 저렴해야합니다. http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1을 보면 초침이 싼 것 같습니다.

오래되었으며 고전 통계에 집중합니다. 고도로 추상적이지는 않지만 합리적인 수학적 관객을 대상으로합니다. 대부분의 연습은 기본적으로 MSc 인 수학 통계의 캠브리지 (영국) 디플로마 과정입니다.


3

지식 측정과 관련하여 : 1 , 2 , 3 , 4 와 같은 일부 데이터 마이닝 / 데이터 분석 경쟁에 참석 하여 다른 사람과 비교하여 점수를 얻는 방법을 확인할 수 있습니다.

답변에 수학 통계에 관한 교과서에 대한 많은 포인터가 있습니다. 관련 주제로 추가하고 싶습니다.

  • 샘플링 이론, 사회 인구 통계 및 지역 표준을 포함하는 경험적 사회 연구 구성 요소
  • 데이터베이스에 대한 지식 (SQL 쿼리 작성, 공통 데이터베이스 체계 작성)을 포함하는 데이터 관리
  • 커뮤니케이션, 시청자가 깨어있는 방식으로 결과를 제시하는 방법 (시각화 방법)

면책 조항 : 나는 통계학자가 아닙니다. 이것은 단지 2 센트입니다.


3

ET Jaynes "확률 이론 : 과학의 논리 : 원리와 초등 응용 프로그램 Vol 1", Cambridge University Press, 2003은 Bayesian 측 통계에있어 거의 정확한 수준으로 읽어야 할 내용입니다. 나는 빈번한 측면에 대한 권장 사항을 기대하고 있습니다 (많은 논문이 있지만 좋은 일반 텍스트는 거의 없습니다).


3
나는 좋은 통계 학자, Frequentist, Bayesian 또는 다른 어떤 사람이되기를 원하는 사람이라면 반드시 읽어야한다고 제안합니다 .
probabilityislogic

10
Jaynes의 책은이 상황에서 끔찍한 추천이다. 3) 또한) 소외의 모순과 오류 (거기 (영업은 "짧은 경로"를 요청)
사이먼 번

1
@Dikran Marsupial, 통계 추론에 대한 Schervish 텍스트를 소유하고 있습니까? 나는 구입 여부에 관해 울타리에 있었기 때문에 당신이 베이지안 접근 방식에 꽤 강력하게 일치하는 것처럼 보이기 때문에 호기심이 많았습니다.
추기경

1
나는 베이지안 접근법에 강력히 부합한다고 말하지 않을 것입니다. 내가 가장 잘 이해하는 접근 방식은 동일하지 않습니다. 기본적으로 저는 엔지니어입니다. 도구 상자에있는 두 도구를 모두 양호한 상태로 유지하고 싶습니다! 각 접근법의 장단점에 대한 올바른 이해는 우리가 목표로 삼아야 할 것입니다. 나는 Shervishes 책을 얻지 못했지만 나에게 상당히 결함이있는 것으로 보이는 그의 Bayes 요인에 대한 논문을 읽었습니다 (내가 그것을 찾을 수 있는지 누군가에게 나에게 설명 할 수 있는지 질문 할 것입니다!).
Dikran Marsupial

@Dikran, 당신의 (잠재적 인) 질문은 흥미있는 것 같습니다. 나는 그것에 대한 게시물을 기대합니다.
추기경

3

저는 기계 학습에 중점을 둔 컴퓨터 과학 배경에서 왔습니다. 그러나 저는 비숍 스 북 https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book을 사용하여 패턴 인식 코스를 수강 한 후 통계를 이해하고 적용하는 것이 더 중요했습니다.

다음은 MIT의 강의 슬라이드입니다.
http://www.ai.mit.edu/courses/6.867-f03/lectures.html

이것은 실제 작업 문제에 대한 통계를 사용하는 배경 (+ 일부 matlab 코드)을 제공하며 적용 측면에 더 가깝습니다.

그러나 그것은 지식으로 무엇을하고 싶은지에 달려 있습니다. 얼마나 좋은지 측정하기 위해 고급 통계 과정에 대한 일부 대학의 공개 코스웨어를 탐색하여 다루는 주제를 알고 있는지 확인할 수 있습니다. 그냥 내 5 센트.


1

스탠포드는 ​​유연성면에서 최고의 리소스를 제공한다고 생각합니다. 그들은 온라인으로 기계 학습 과정을 가지고 있습니다.이 알고리즘은 R에서 알고리즘을 설계 할 때 존경받을만한 지식 기반을 제공합니다 .Google에서 검색하면 흥미로운 과정이있는 Lagunita 페이지로 리디렉션됩니다. 그들은 자유 롭다. 나는 Tibshirani의 저서, Statistical Learning에 대한 소개 '와'Statistical Learning의 요소 '를 PDF 형식으로 가지고 있으며 모두 훌륭한 자료입니다.

당신은 수학자이기 때문에 앞으로도 진지한 기계 학습을 시작하면 미래에 매우 도움이 될만한 견고한 기반을 제공하지 않을 것이므로 빠른 추적을하지 않는 것이 좋습니다. 통계를 데이터에서 통찰력을 얻는 데 필요한 수학의 한 가지로 취급하면 약간의 작업이 필요합니다. 그 외에도 많은 온라인 자료가 있으며 Johns Hopkins는 Stanford와 비슷한 자료를 제공합니다. 경험은 항상 지불하지만, 훌륭한 자격 증명은 항상 그 기반을 강화합니다. 입력하려는 특정 필드를 생각할 수도 있습니다. 그것은 당신이 텍스트 분석에 들어가고 싶거나 금융에 수학과 통계 기술을 적용할지 여부를 의미합니다. 나는 후자에 속하므로 재무 + 통계를 공부 한 계량 경제학 학위가 있습니다. 조합은 항상 매우 좋습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.