참조 요청 : 작업 데이터 과학자를위한 클래식 통계


10

저는 회귀 분석, 다른 기계 학습 유형 알고리즘 및 프로그래밍 (데이터 분석 및 일반 소프트웨어 개발 모두)에 대한 탄탄한 경험을 가진 실무 데이터 과학자입니다. 대부분의 작업 생활은 예측 정확도 (다양한 비즈니스 제약 조건 하에서 작업)를위한 모델을 구축하고 내 자신 및 다른 작업을 지원하는 데이터 파이프 라인을 구축하는 데 중점을 두었습니다.

나는 통계에 대한 공식적인 훈련이 없으며, 순수한 수학에 중점을 둔 대학 교육이 있습니다. 이와 같이 많은 고전적 주제들, 특히 다양한 대중 가설 검정과 추론 기법을 배우는 데 실패했습니다.

내 배경과 경험 수준을 가진 사람에게 적합한 이러한 주제에 대한 언급이 있습니까? 나는 수학적 조작을 다루고 이해할 수 있으며 알고리즘 관점을 즐길 수 있습니다. 나는 수학적으로나 프로그래밍에 중점을 둔 독자 가이드 연습을 제공하는 참조를 좋아하는 경향이 있습니다.


2
통계에 대한 지식이 부족한 수학 배경의 다른 매트로서, 나는 관련이 있습니다! 관심있는 특정 영역 / 응용 프로그램이 있습니까? 고전 통계에서주의해야 할 것은 가정이 사용되는 것입니다.
GeoMatt22

5
여기에 몇 가지 좋은 참고 자료가 있습니다. mathoverflow.net/questions/31655/statistics-for-mathematicians
Alex R.

답변:


3

Larry Wasserman의 All of Statistics 는 수학 통계에 대한 회오리 바람 여행을위한 훌륭한 책입니다. 내가 사용한 수학 통계에 관한 첫 번째 책이었습니다. 여기에는 가설 검정 및 최대 가능성 추정과 같은 고전이 포함되지만 부트 스트래핑과 같이 더 최근에 개발되었지만 똑같이 중요한 주제가 많이 포함됩니다. Wasserman은 항상 통계에서 한 발, 기계 학습에서 다른 발을 가지고 있습니다. 모든 현대 데이터 분석가가해야한다고 생각합니다. 두 분야 중 한 분야에만 익숙하다면 많은 것을 놓치게 될 것입니다. 또한이 책에는 좋은 연습이 많이 있습니다.

실제 분석에 대한 배경 지식이 있고 확률과 통계의 측정 이론적 처리를 의미하는 원시적이고 자르지 않은 것을 원한다면 Mark J. Schervish의 통계 이론을 사용해보십시오 . Schervish는 DeGroot와 Schervish의 절반으로, 기술 통계 가 적은 확률과 통계 는 오늘날 수학 통계에서 가장 인기있는 책일 것입니다. 통계 이론은 모든 작업을 스스로 수행해야하는 대학원생을 위해 일반적으로 예약 된 주제에 대한 유용한 토픽 책입니다. 솔직히 말해서, 나는이 책이 매우 어렵다는 것을 알았습니다. (준 샤오의 수학 통계 만큼 어렵지는 않지만)) 결국 마스터 링에 필요한 엄청난 노력을 응용 데이터 분석가로서 제 시간을 잘 활용하지 못했다는 느낌이 들었습니다. 그러나 나는 아직도 많은 것을 배웠고 측정 이론이 무엇인지, 그리고 확률 이론에 대한보다 순진한 전통적인 접근 방식에서 발생하는 털이 이론적 인 어려움을 해결하는 데 어떻게 사용될 수 있는지에 대해 잘 이해했습니다. 또한 교환 성과 독립성의 유사점과 차이점을 더 잘 이해하게되었습니다.


2

Kodiologist의 매우 좋은 제안 외에 (+1) 나는 또한 관찰 연구 의 주제를 살펴볼 것을 권장 합니다. 많은 경우에 분석 된 데이터가 관찰 적이라는 사실에도 불구하고 데이터 과학자들 사이에 매우 감사할만한 분야라고 생각합니다. 이것은 대량의 서지 (특히 생물 통계학에서)가 적어도 일부 준 실험적 설계가 이미 있다고 가정하기 때문이라고 생각합니다. Paul Rosenbaum의 관측 연구관찰 연구 설계 는 가장 일반적으로 사용되는 참고 문헌 중 일부입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.