(매우) 단편
간단히 말해서, 어떤 의미에서 통계는 다른 기술 분야와 같습니다 . 빠른 트랙이 없습니다 .
긴 이야기
통계학 학사 학위 프로그램은 미국에서 비교적 드문 경우 이것이 사실이라고 생각하는 한 가지 이유는 통계학을 배우는 데 필요한 모든 것을 학부 커리큘럼에 포함시키기가 매우 어렵다는 것입니다. 이것은 상당한 일반 교육 요건이있는 대학에서 특히 중요합니다.
필요한 기술 (수학적, 계산 및 직관적)을 개발하려면 많은 노력과 시간이 필요합니다. 일단 학생이 미적분학과 상당한 양의 선형 및 행렬 대수를 숙달하면 통계는 상당히 적절한 "작동"수준에서 이해되기 시작할 수 있습니다. 그러나 응용 통계학자는 쿠키 커터 또는 레시피 기반 통계에 대한 접근 방식을 따르지 않는 영역에서 자신을 찾기가 매우 쉽다는 것을 알고 있습니다. 표면 아래에서 일어나는 일을 실제로 이해하려면 전제 조건이 필요합니다.오늘날의 세계에서 수학과 후반의 학부 훈련에서만 얻을 수있는 전산 성숙도. 이것이 사실 통계 훈련이 미국의 MS 수준에서 주로 시작하는 이유 중 하나입니다 (인도, ISI 전담은 약간 다른 이야기입니다. 일부 캐나다 기반 교육에 대해서도 비슷한 주장이있을 수 있습니다. 정보에 근거를 둔 유럽 기반 또는 러시아 기반 학부 통계 교육.)
거의 모든 (흥미로운) 직업은 MS 수준의 교육을 필요로 할 것이고, 정말로 흥미로운 (제 생각에는) 직업은 본질적으로 박사 수준의 교육을 요구합니다.
수학 박사 학위를 받았을 때 어떤 분야를 알지 못하지만 MS 수준의 교육에 더 가까운 것에 대한 제 제안은 다음과 같습니다. 선택 사항을 설명하기 위해 몇 가지 괄호가 있습니다.
- D. 허프, 통계와 거짓말하는 법 . (매우 빠르고 쉽게 읽을 수 있습니다. 특히 평신도에게 통계를 제시 할 때 많은 개념적 아이디어와 함정을 보여줍니다.)
- Mood, Graybill 및 Boes, 1974 년 3 월 3 일 통계 이론 소개 . (이론적 통계에 대한 MS 수준의 소개. 고전적이고 빈번한 틀에서 샘플링 분포, 점 추정 및 가설 검정에 대해 배우게됩니다. 의견은 이것이 Casella & Berger 또는 Rice와 같은 현대의 제품보다 일반적으로 더 우수하고 약간 더 진보적이라는 것입니다.)
- Seber & Lee, 선형 회귀 분석 , 2 차 (적용된 통계에서 이해해야 할 가장 중요한 주제 인 선형 모델에 대한 포인트 추정 및 가설 검정 이론을 제시합니다. 아마도 선형 대수 배경이 우수 할 것이므로 기하학적으로 진행되는 상황을 즉시 이해할 수 있어야합니다. 모델 선택, 가정에서 벗어남, 예측 및 강력한 선형 모델 버전의 평가 문제와 관련된 유용한 정보도 제공합니다.)
- Hastie, Tibshirani 및 Friedman, 통계 학습의 요소 , 2nd ed., 2009. (이 책은 마지막 것보다 훨씬 더 많은 감정을 가졌으며 많은 현대 기계 학습 주제를 다룹니다. 여기서 중요한 기여는 통계 해석을 제공하는 것입니다. 특히 모델에 불확실성을 정량화에 떨어져 지불 많은 기계 학습 아이디어,의. 이것은 유엔 (데르) 일반 기계 학습 책에서 다루어 이동합니다. 무료로 합법적으로 사용할 수 경향이 뭔가 여기에 .)
- A. Agresti, 범주 형 데이터 분석 , 2 차 개정판. (통계 프레임 워크에서 불연속 데이터를 처리하는 방법에 대한 훌륭한 프레젠테이션. 좋은 이론과 실제 사례. 아마도 어떤면에서는 전통적인 측면 일 것입니다.)
- Boyd & Vandenberghe, 볼록 최적화 . (가장 인기있는 현대 통계 추정 및 가설 검증 문제는 볼록 최적화 문제로 공식화 될 수 있습니다. 이는 SVM과 같은 수많은 기계 학습 기술에도 적용됩니다. 제 생각에는 아주 귀중 합니다 . 여기서 합법적으로 무료로 이용할 수 있습니다 .)
- Efron & Tibshirani, 부트 스트랩 소개 . (최소한의 부트 스트랩 및 관련 기술에 익숙해야합니다. 교과서의 경우 빠르고 쉽게 읽을 수 있습니다.)
- J. Liu, 과학 컴퓨팅의 Monte Carlo 전략 또는 금융 공학의 Monte Carlo 방법 인 P. Glasserman . (후자는 특정 응용 분야와 관련이 있지만, 가장 중요한 모든 기술에 대한 좋은 개요와 실제적인 예를 제공 할 것이라고 생각합니다. 금융 공학 응용 프로그램은 지난 10여 년 동안 상당한 양의 Monte Carlo 연구를 주도했습니다. .)
- E. Tufte, 정량적 정보의 시각적 표시 . (통계 전문가들조차도 데이터의 우수한 시각화 및 표현은 과소 평가되었습니다.)
- J. Tukey, 탐색 적 데이터 분석 . (표준. Oldie이지만 goodie. 일부는 구식이라고 할 수도 있지만 여전히 살펴볼 가치가 있습니다.)
보완
여기에 약간 더 진보적이고 이론적이거나 보조적인 성격을 가진 다른 책들이 있습니다.
- FA Graybill, 선형 모형의 이론 및 응용 . (구식, 끔찍한 조판이지만 Seber & Lee의 모든 동일한 근거 등을 다루고 있습니다. 더 현대적인 치료법은 아마도 SVD를 사용하여 많은 기술과 증거를 통합하고 단순화하는 경향이 있기 때문에 구식이라고 말합니다.)
- FA Graybill, 통계 응용 프로그램이 포함 된 행렬 . (위의 컴패니언 텍스트. 여기에는 통계에 유용한 훌륭한 행렬 대수 결과가 풍부합니다. 훌륭한 책상 참조.)
- Devroye, Gyorfi 및 패턴 인식의 확률론 인 Lugosi . (분류 문제에서 성능을 정량화하는 것에 대한 엄격하고 이론적 인 텍스트)
- Brockwell & Davis, 시계열 : 이론 및 방법 . (클래식 시계열 분석. 이론적 처리. 더 많은 것들을 위해 Box, Jenkins & Reinsel 또는 Ruey Tsay의 텍스트는 괜찮습니다.)
- Motwani와 Raghavan, 무작위 알고리즘 . (계산 알고리즘에 대한 확률 적 방법 및 분석)
- D. Williams, 확률 및 Martingales 및 / 또는 R. Durrett, 확률 : 이론 및 예 . (DL Cohn 수준에서 측정 이론을 보았지만 확률 이론이 아닐 수도 있습니다. 이미 측정 이론을 알고 있다면 둘 다 빠르게 속도를내는 데 좋습니다.)
- F. Harrell, 회귀 모델링 전략 . ( ESL ( 요소 통계 학습) 만큼 좋지는 않지만, 다른 흥미롭고 흥미로운 것들이 있습니다. ESL보다 더 많은 "전통적인"응용 통계 주제를 다루므로 확실히 알고 있어야합니다.
보다 고급 (의사 수준) 텍스트
Lehmann and Casella, 포인트 추정 이론 . (PhD 수준의 포인트 추정 처리.이 책의 과제 중 하나는이 책을 읽고 오타가 무엇인지 아닌지를 파악하는 것입니다. 빠르게 인식하고 있다는 것을 알면 이해하게 될 것입니다. 연습이 많이 있습니다. 이 문제는 특히 문제에 빠질 경우 특히 유용합니다.)
통계적 가설을 테스트하는 Lehmann and Romano . (가설 테스트의 박사 수준 치료. 위의 TPE만큼 오타가 아닙니다.)
A. van der Vaart, 점근 통계 . (응용 분야에 대한 힌트가 좋은 통계 점근 법 이론에 대한 아름다운 책. 적용되는 책은 아닙니다. 나의 유일한 퀴즈는 다소 기괴한 표기법이 사용되고 때로는 세부 사항이 깔개 아래에 솔질되어 있다는 것입니다.)