결론적으로 , 통계에 대해 더 많이 배울수록 내 분야의 논문을 신뢰하는 것이 줄어 듭니다. 나는 연구원들이 통계를 충분히 잘하지 못한다고 생각합니다.
저는 평신도입니다. 저는 생물학 교육을 받았지만 통계 나 수학에 대한 공식 교육은 없습니다. 나는 R을 즐기고 종종 연구를 할 때 적용하는 방법의 이론적 기초를 읽고 이해하려고 노력합니다. 오늘날 분석을 수행하는 대다수의 사람들이 실제로 공식적으로 훈련되지 않았다고해도 놀라지 않을 것입니다. 나는 약 20 개의 원본 논문을 발간했는데, 그 중 일부는 인정 된 저널과 통계 학자에 의해 승인되었으며, 종종 검토 과정에 관여했습니다. 내 분석에는 일반적으로 생존 분석, 선형 회귀, 로지스틱 회귀, 혼합 모형이 포함됩니다. 검토자가 모델 가정, 적합 또는 평가에 대해 질문 한 적이 없습니다.
따라서 모델 가정, 적합 및 평가에 대해 너무 신경 쓰지 않았습니다. 가설로 시작하여 회귀를 실행 한 다음 결과를 제시합니다. 어떤 경우에는 내가이 일을 평가하는 노력을하지만, 난 항상 함께 결국 " 잘은 모든 가정 사항을 충족하지 못했지만, 그 결과를 신뢰 ("주제 지식 ")과 잘 그래서 그들은 그럴듯하다 "와 통계 학자와상의 할 때 그들은 항상 동의하는 것처럼 보였다.
이제 저는 스스로 분석을 수행하는 다른 통계 학자와 비 통계 학자 (화학자, 의사 및 생물 학자)와 이야기했습니다. 사람들은 실제로 이러한 모든 가정과 공식 평가에 대해 너무 귀찮게하지 않는 것 같습니다. 그러나 CV에는 잔차, 모델 적합, 평가 방법, 고유 값, 벡터 및 목록에 대해 묻는 많은 사람들이 있습니다. lme4가 큰 고유 값에 대해 경고 할 때 이런 식으로 설명하겠습니다.
추가 노력의 가치가 있습니까? 게시 된 모든 결과의 대부분이 이러한 가정을 존중하지 않으며 평가하지 않았을 가능성이 있습니까? 데이터베이스가 매일 커지고 있기 때문에 데이터가 커질수록 가정과 평가가 덜 중요하다는 개념이 있기 때문에 이것은 아마도 점점 커지고있는 문제 일 것입니다.
나는 절대적으로 틀릴 수 있지만 이것이 내가 이것을 인식 한 방법입니다.
업데이트 : StasK에서 빌린 인용 (아래) : http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15509