흥미롭고 잘 작성된 통계 자료는 무엇입니까?


28

재미 있고 유익한 정보를 얻을 수있는 통계 적용 에 대해 설명하는 좋은 논문은 무엇입니까 ? 명확히하기 위해, 나는 실제로 새로운 통계 방법을 설명하는 논문 (예를 들어, 최소 각도 회귀 논문)을 찾는 것이 아니라 실제 문제를 해결하는 방법을 설명하는 논문을 찾고 있습니다.

예를 들어, 내가보고있는 것에 맞는 한 종이는 두 번째 Cross-Validated Journal Club 의 기후 종이입니다 . 나는 기계 학습 논문보다는 더 많은 통계-논문을 찾고 있지만, 그것은 약간의 퍼지 구별이라고 생각합니다 (Netflix Prize 논문을 약간의 경계선으로 분류하고 감정 분석에 대한 논문을 무언가로 분류했습니다) 난 하지 )를 찾고.

내가 본 통계의 대부분의 응용 프로그램은 교과서에서 볼 수있는 작은 스 니펫이거나 내 작업과 관련된 것이므로 조금 분기하고 싶습니다.


4
당신이 나열하고 싶은 일반적인 관심사가 있습니까? 제안을 안내하는 데 도움이 될 수 있습니다. 통계의 응용은 매우 광범위한 분야에서 널리 보급되었습니다.
추기경

1
@ cardinal, nope, 특별한 관심사 없음-목적은 일반적으로 읽은 내용에서 벗어나는 것이 었으므로 대답을 제한하지 않으려 고합니다. (이것은 아마도 질문을 너무 광범위하게 만들지 만, 나는 사람들의 개인적인 "최고의"목록을 찾고 있다고 생각합니다.)
raegtin

1
고전적인 필독서, 특히 도입 된 모든 확률 모델이 모자에서 뽑히지 않고 문제에 대한 "물리적"추론에 의해 동기를 부여 받기 때문에 : F. Mosteller, DL Wallace (1963) : 저작자 문제의 추론 : 분쟁이 발생한 연방 정부 논문 의 저자에 적용되는 차별 방법에 대한 비교 연구 , J. Am. 통계 Assoc. 58 (302), 275–309 쪽. 또한 이 링크에서 .
pglpm

답변:


12

관심있는 논문이 무엇인지 파악하기가 다소 어려우므로 심리학 문헌에서 다음 논문을 제안하고 제안하겠습니다.

Borsboom, D. (2006). 심리학자의 공격 . Psychometrika , 71 , 425-440.

장면을 드레싱하기 위해 (왜 우리는 심리학 연구에서 일반적으로 발견되는 기본 가설을 더 잘 반영하는 통계 모델을 사용해야합니까?)

Borsboom, D. (2008). 진단 시스템에 대한 심리학 적 관점 . 임상 심리학 저널 , 64 , 1089-1108.

진단 의학에 적용되는 관점 (DSM-IV에 사용 된 예 / 아니오 평가에서 DSM-V를위한 "차원"접근으로의 전환). 내가 좋아하는 생물 의학 연구에서 잠재 변수 모델에 대한 더 큰 검토는 다음과 같습니다.

Rabe-Hesketh, S. and Skrondal, A. (2008). 의료 연구를위한 클래식 잠재 변수 모델 . 의학 연구의 통계적 방법 , 17 (1) , 5-32.


@ chl (+1) 그 Borsboom 논문은 훌륭했습니다. 그들은 측정에 대한 나의 생각을 넓혔습니다
richiemorrisroe

+1, 나는 Borsboom도 즐긴다. The Attack 기사에 관심이있는 사람들은 "유효성 개념"( rhowell.ba.ttu.edu/borsboomValidity2004.pdf) 에도 관심이 있다고 생각 합니다. 조금 더 장황하지만 공격 기사만큼 쉽게 따라 할 수는 없습니다.
Andy W

10

다음은 지난 40 년간 왕립 통계 협회 저널 시리즈 C : Applied Statistics 의 Web of Knowledge 검색 결과를 통해 스캔하는 동안 눈에 띄는 제목이 명확하게 적용된 5 개의 논문입니다 .


9

2001 년 레오 브레이 먼 (Lea Breiman)의 [ "통계 모델링 : 두 문화"] [1] 논문을 더 넓은 차원에서 추천한다 (515 명 인용) 나는 그것이 최근 저널 클럽에 의해 다루어 진 것을 알고 정말 흥미있는 것을 발견했다. 나는 초록을 c & p'd했다.

추상. 통계적 모델링을 사용하여 데이터의 결론에 도달하는 데에는 두 가지 문화가 있습니다. 주어진 확률 데이터 모델에 의해 데이터가 생성된다고 가정합니다. 다른 하나는 알고리즘 모델을 사용하고 데이터 메커니즘을 알 수없는 것으로 취급합니다. 통계 커뮤니티는 거의 독점적으로 데이터 모델을 사용하기 위해 노력해 왔습니다. 이러한 노력은 관련이없는 이론, 의심스러운 결론으로 ​​이어졌으며 통계 학자들이 광범위한 흥미로운 현재 문제에 대해 작업하지 못하게했습니다. 이론과 실습에서 알고리즘 모델링은 통계 외부의 분야에서 빠르게 발전했습니다. 대규모의 복잡한 데이터 세트와 소규모 데이터 세트의 데이터 모델링에 대한보다 정확하고 유익한 대안으로 사용할 수 있습니다. 필드로서의 목표가 데이터를 사용하여 문제를 해결하는 것이라면,

[1] : https://doi.org/10.1214/ss/1009213726 (공개 액세스)


8

유전 적 역학 관점에서, 나는 이제 게놈 전체 연관 연구에 관한 다음의 일련의 논문을 추천 할 것이다 :

  1. Cordell, HJ 및 Clayton, DG (2005). 유전자 관련 연구 . 란셋 366, 1121-1131.
  2. Cantor, RM, Lange, K. 및 Sinsheimer, JS (2010). GWAS 결과 우선 순위 : 통계적 방법 및 적용에 대한 권장 사항 검토 . 미국 인간 유전학 저널 86, 6–22.
  3. Ioannidis, JPA, Thomas, G., Daly, MJ (2009). 게놈 전체 연관 신호의 검증, 증강 및 정제 . Nature Reviews Genetics 10, 318-329.
  4. Balding, DJ (2006). 인구 연관 연구를위한 통계적 방법에 대한 튜토리얼 . Nature Reviews Genetics 7, 781-791.
  5. Green, AE et al. (2008). 인지 신경 과학에서 유전자 데이터 사용 : 통증 증가에서 진정한 통찰력까지 . Nature Reviews Neuroscience 9, 710-720.
  6. McCarthy, MI et al. (2008). 복잡한 특성에 대한 게놈 차원의 연관성 연구 : 합의, 불확실성 및 도전 . Nature Reviews Genetics 9, 356-369.
  7. 정신과 GWAS 컨소시엄 조정위원회 (2009). 게놈 협회 연구 : 정신 장애에 대한 역사, 근거 및 전망 . 미국 정신과 학회지 166 (5), 540-556.
  8. Sebastiani, P. et al. (2009). 게놈 전반의 연관성 연구와 복잡한 특성의 유전자 해부 . 미국 혈액학 저널 84 (8), 504-15.
  9. Wellcome Trust Case Control 컨소시엄 (2007). 7 가지 일반적인 질병 13,000 건과 3,000 가지 공동 통제에 대한 게놈 전체의 연관성 연구 . 자연 447, 661-678.
  10. Wellcome Trust Case Control 컨소시엄 (2010). 8 개의 흔한 질병과 3,000 개의 공유 컨트롤이있는 16,000 건의 CNV에 대한 게놈-전역 협회 연구 . 자연 464, 713-720.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.