통계 이론 및 응용 프로그램에서 이해하기


13

저는 최근 공학 및 수학을 배경으로 의학 및 생물학 모델링 석사 학위를 취득했습니다. 교육 프로그램에 상당히 많은 수의 수학 통계 (아래 목록 참조) 과정이 포함되어 있었지만 통계와 이론의 적용에 대해 완전히 잃어버린 경우가 종종 있습니다. "순수한"수학과 비교할 때 통계는 실제로 의미가 없습니다. 특히 대부분의 통계 학자 (내 과거 강사를 포함)가 사용하는 표기법과 언어는 성가 시게 복잡하고, 지금까지 본 위키피디아를 포함하여 볼 수있는 자료 중 어느 것도 쉽게 관련되고 주어진 이론과 관련이있을 수있는 간단한 예가 없었습니다. ..

이것이 배경입니다. 또한 통계, 특히 생물 정보학 분야에서 확고한 파악 없이는 연구원 / 엔지니어로 경력을 쌓을 수없는 쓴 현실을 알고 있습니다.

더 숙련 된 통계 학자 / 수학자로부터 팁을 얻을 수 있기를 바랐습니다. 위에서 언급 한이 문제를 어떻게 극복 할 수 있습니까? 좋은 자원을 알고 있습니까? 서적, 전자 책, 공개 과정 ​​(예 : iTunes 또는 OpenCourseware를 통해) 등

편집 : 내가 언급했듯이 나는 일반적인 통계 제목에 따라 대부분의 문헌에 대해 (부정적으로) 편견이 있으며 통계 분기당 많은 (비싸고) 많은 교과서를 구입할 수 없기 때문에 필요한 것 책의 관점에서 Tipler & Mosca 가 물리학에 대한 것과 비슷 하지만 통계에 대한 것입니다.

Tipler에 대해 모르는 사람들을 위해; 이 책은 고학 과정에서 접할 수있는 대부분의 주제를 다루는 기본 교과서이며 기본 소개에서 약간 더 자세하게 설명합니다. 기본적으로 완벽한 참조 서적은 uni에서 첫해에 구입했지만 한 번에 한 번씩 사용합니다.


내가 통계에 취한 과정 :

  • 대규모 소개 과정
  • 고정 확률 과정,
  • 마르코프 프로세스
  • 몬테카를로 방법
  • 생존 분석

답변:


4

나는 당신의 상황을 완전히 이해할 수 있습니다. 비록 박사 과정 학생이지만, 때때로 관련된 이론과 응용에 어려움을 겪습니다. 이론을 이해하는 데 기꺼이 몰두하면 실제 문제에 대해 생각할 때 확실히 보상됩니다. 그러나 프로세스가 좌절 될 수 있습니다.

내가 좋아하는 많은 참조 중 하나는 Gelman 및 Hill의 계층 적 / 다단계 모델을 사용한 데이터 분석 입니다. 그들은 시뮬레이션을 사용하여 기본 개념을 표현할 수있는 이론을 피합니다. MCMC 등에서 경험을 쌓으면 확실히 도움이 될 것입니다. 당신이 말하는 것처럼, 당신은 생물 정보학에서 일하고 있습니다. 아마도 Harrell 's Regression Modeling Strategies 도 훌륭한 참고 자료입니다.

나는 이것을 커뮤니티 위키로 만들고 다른 사람들이 그것을 추가하도록 할 것이다.


문제에 관심을 가져 주셔서 감사합니다. 내가 물건에 대해 혼란스러워하는 유일한 사람이 아니라는 것을 알게되어 기쁩니다. 나는 당신이 내 상황을 과대 평가했다고 생각합니다. 여러 과정을 수강하고 여러 가지 다른 통계 분석 방법이 있다는 것을 잘 알고 있습니다. 그들은 강의 후에 나에게 붙어 있지 않습니다. 시험 몇 달 후, 나는 계속 궁금해하고 있습니다. "어딘가에서 이것을 보았거나 들었지만 실제로 어떻게 작동 했습니까?" 이것은 나에게 그것을 완전히 분해하고 더 강한 기초로 그것을 짓기 시작해야 함을 제안합니다.
posdef 2016

Harrell의 (주문 철자) 텍스트에 대해 "합의"를 추가 할 것입니다. 함께 제공되는 R 코드의 두 패키지 조합이 우수합니다. 또한 Venables와 Ripley의 "S를 사용한 현대 응용 통계"는 좋은 인수라고 생각합니다. 나는 MASS를 사용하여 R을 배우기 전에 석사 수준의 배경 (물리학으로 학위가 있음)을 가지고있었습니다. 그 본문에는 풍부한 응용 지혜가 있습니다.
DWin

Gelman 회귀 책은 훌륭하고 모든 것을 잘 설명하며 재료에 대한 이해를 확인하는 데 실제로 유용한 R 코드를 제공합니다.
richiemorrisroe

2

베이지안 데이터 분석 (Gelman, Carlin, Stern 및 Rubin)에 익숙 하십니까? 아마도 그것은 당신이 복용해야 할 것입니다.


2

본질적으로 모든 통계 문제는 다음 4 단계로 이어 집니다 (다른 질문에 대한 @ whuber 답변에서 빌려 왔습니다 ).

  1. 모수를 추정하십시오.

  2. 해당 추정치의 품질을 평가하십시오.

  3. 데이터를 탐색하십시오.

  4. 적합을 평가하십시오.

단어 모델 과 단어 매개 변수 를 교환 할 수 있습니다 .

통계 서적은 일반적으로 다양한 상황에 대한 처음 두 지점을 제시합니다. 각 실제 응용 프로그램마다 다른 접근 방식이 필요하므로 다른 모델이 필요하므로 책의 대부분이 이러한 다른 모델을 카탈로그 화합니다. 이것은 바람직하지 않은 영향을 미치므로 세부 사항에서 자신을 잃고 큰 그림을 놓치기 쉽습니다.

내가 진심으로 추천하는 큰 그림책은 점근 통계 입니다. 그것은 주제에 대한 엄격한 치료를 제공하며 수학적으로 "순수"합니다. 제목에 점근 적 통계가 언급되어 있지만 가장 큰 비밀은 대부분의 고전적 통계 방법이 본질적으로 점근 적 결과에 기반한다는 것입니다.


2

여기서 가장 중요한 것은 통계와 일반적인 통계 개념에 대한 직관을 개발하는 것입니다. 이 작업을 수행하는 가장 좋은 방법은 "소유"할 수있는 도메인을 갖는 것입니다. 이는 도메인에 대한 이해가 기본 통계에 대해 더 많이 이해하고 도메인 등에 대해 더 많이 이해하는 데 도움이되는 긍정적 인 피드백 루프를 제공 할 수 있습니다.

저에게 그 도메인은 야구 통계였습니다. 게임에서 4를 3으로하는 타자는 "참".750 타자가 아님을 이해했습니다. 이는 표본 데이터가 기본 분포와 같지 않다는보다 일반적인 요점을 이해하는 데 도움이됩니다. 또한 그는 .750 타자보다는 보통 선수와 더 가까울 것이므로 평균에 대한 회귀와 같은 개념을 이해하는 데 도움이됩니다. 거기에서 나는 사전 확률 분포가 평균 야구 선수의 평균 확률을 갖는 완전한 베이지안 추론에 도달 할 수 있으며, 이제 후방 분포를 업데이트 할 4 개의 새로운 샘플이 있습니다.

나는 그 도메인이 당신을 위해 무엇인지 모른다. 그러나 나는 그것이 단순한 교과서보다 더 도움이 될 것이라고 생각한다. 예는 이론을 이해하는 데 도움이되며 이는 예를 이해하는 데 도움이됩니다. 예제가 포함 된 교과서는 훌륭하지만, 예제를 "귀하의 것으로"만들 수 없다면, 충분히 얻을 수 있을지 궁금합니다.


1

회귀 모델링 전략에 대한 대안으로,보다 실용적인 접근 방식으로 Applied Linear Statistical Models 는 제 관점에서 매우 좋습니다.


1

사람마다 다르게 배우지 만, 예제, 예제, 예제가 통계에 많은 도움이된다고 말하는 것이 안전하다고 생각합니다. 내 제안은 R을 배우는 것입니다 (기본은 많은 것을 돕기에 충분합니다). 눈이 번질 때까지 모든 예를 시도해보십시오. 정렬, 맞춤, 플롯, 이름을 지정할 수 있습니다. R은 통계에 맞춰져 있으므로 R을 배우면 통계를 배우게됩니다. 당신이 나열한 책들은 "Show me"관점에서 공격받을 수 있습니다.

R은 무료이며 많은 소스 자료는 무료이므로 투자해야 할 시간입니다.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

R에 관한 좋은 책들이 많이 있습니다. 여기 제가 사용한 책이 있습니다 :

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

편집 ============

몇 개의 링크를 추가하는 것을 잊었습니다. Windows를 사용하는 경우 R을 제공하는 훌륭한 편집기는 Tinn-R입니다 (다른 사용자는 Mac 또는 Linux에서 편집기 링크를 추가 할 수 있음).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


연결에 감사드립니다, 나는 앞으로 몇 주 동안 가능한 한 많이 그들을 통해 시도 할 것입니다 ... 나는 우리가 많은 다변량 회귀 (cox와 aelen)를 수행 한 생존 분석 과정에서 R에 한 번 노출되었습니다. 모델) 및 내가 실제로 기억할 수없는 많은 것들. MATLAB에 매우 익숙한 사람으로서의 R에 대한 나의 인상은 상당히 부정적이지만, 우리가 수영장의 깊은 끝에 던져 졌다는 사실과 관련이 있습니다. 우리 자신의 수영, 물론 그때부터 소프트웨어를 싫어하게했습니다. :) 아마도 그것을 바꿀 시간
posdef

1

나는 개인적으로 사랑 (예 많은) 이론과 응용 프로그램의 정말 좋은 혼합이 있던합니다. 보다 이론적 인 접근 방식을 위해서는 casella 및 berger와 잘 일치했습니다. 그리고 광범위한 브러시 개요를 위해 .


두 책 모두 아마존에 대한 좋은 리뷰를 가지고있는 것 같습니다. 아무도 이것에 대한 의견을 추가 할 수 있습니까? btw; casella & berger는 "통계적 추론"을 의미합니까?
posdef 2013

네 '통계 추론'. 저에게 큰 단계는 확률 모델 이해에서 데이터를 사용하여 모델을 테스트하고 모델의 모수를 추정하는 방법을 이해하는 것입니다. 특히 Davison 책은이 점에 중점을 둡니다.
alwaysean
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.