데이터 분석을 계속 배우기 위해 정기적 인 시간 투자를 할 수 없을 것이라고 생각합니다
Casella & Berger는 데이터 분석 방식으로 데이터를 많이 배울 수있는 곳이라고 생각하지 않습니다 . 통계 이론의 도구를 배울 수있는 곳입니다.
지금까지 통계로 알려주는 경험은 다양한 분포 (Weibull, Cauchy, t, F ...)와 관련된 많은 지루한 계산을 견뎌야합니다.
통계 학자로서 데이터 분석을하는 데 많은 시간을 보냈습니다. 거의 지루한 계산을하는 일은 거의 없습니다. 때로는 약간의 간단한 대수가 필요하지만 일반적인 문제는 일반적으로 해결되므로 매번 복제하는 데 노력을 기울일 필요가 없습니다.
컴퓨터는 모든 지루한 계산을 수행합니다.
합리적인 표준 사례를 가정 할 준비가되지 않은 상황 (예 : GLM을 사용할 준비가되지 않은 상황) 인 경우 일반적으로 다른 분포를 가정 할 정보가 충분하지 않으므로 계산 문제는 LRT는 일반적으로 헛소리입니다. (필요할 때 할 수 있습니다. 이미 해결되었거나 흥미롭게 전환되는 경우가 거의 없습니다).
나는 많은 시뮬레이션을하는 경향이있다. 또한 종종 파라 메트릭 가정과 함께 또는 어떤 형태로 리샘플링을 사용하려고합니다.
예전처럼 주당 20 시간 이상을 소비해야합니까?
그것은 당신이 무엇을하고 싶은지, 얼마나 빨리 당신이 그것을 얻고 싶어하는지에 달려 있습니다.
데이터 분석은 기술이며 실습과 많은 지식 기반이 필요합니다. 이미 필요한 지식이 있습니다.
다양한 일에 능숙한 사람이 되려면 시간이 많이 걸리지 만 대수와 카셀라와 버거 운동을하는 것보다 훨씬 재미 있습니다.
내가 구축 한 기술 중 일부는 회귀 문제가 시계열에 도움이된다고 말하지만 많은 새로운 기술이 필요합니다. 따라서 잔차 그림과 QQ 그림을 해석하는 방법을 배우는 것이 편리하지만 PACF 그림에서 약간의 충돌에 대해 얼마나 걱정해야하는지 알려주지 않고 한 걸음 앞서 예측을 사용하는 것과 같은 도구를 제공하지 않습니다. 오류.
예를 들어, 일반적인 감마 또는 weibull 모델에 대해 ML을 합리적으로 수행하는 방법을 알아 내려는 노력을 기울일 필요가 없습니다 . 왜냐하면 이미 편리한 형태로 들어간 문제를 해결할 수있을 정도로 표준이기 때문입니다.
당신이 온 경우 연구를 , 당신은 더 많은 기술이 필요합니다 당신은 Casella & 버거 (그러나 심지어 기술의 그런 종류로, 당신은 또한 하나 이상의 책을 읽어야한다) 같은 장소에서 픽업.
몇 가지 제안 된 사항 :
아무 것도하지 않아도 회귀 기술을 확실히 구축해야합니다.
꽤 훌륭한 책들이 많이 있지만 아마도 Draper & Smith 응용 회귀 분석 과 Fox 및 Weisberg 응용 회귀 분석 에 대한 동료 ; 또한 Harrell의 회귀 모델링 전략을 따르는 것이 좋습니다.
(Draper와 Smith를 대신하여 여러 권의 좋은 책을 대신 할 수 있습니다. 자신에게 맞는 1-2 가지를 찾으십시오.)
두 번째 책에는 읽을 가치가 많은 온라인 추가 장이 많이 있습니다 (및 자체 R 패키지).
-
좋은 제 2 서빙은 베너 블스 & 리플리의 것 S와 현대 응용 통계 .
그것은 상당히 광범위한 아이디어에 대한 근거입니다.
일부 주제에서 더 기본적인 자료가 필요할 수도 있습니다 (배경 지식은 모르겠습니다).
그런 다음 베이지안 통계, 시계열, 다변량 분석 등 원하는 통계 영역에 대해 생각하기 시작해야합니다.