비 기술적이지만 심층적 인 기사에 대한 권장 사항


24

이 질문에 대한 영감은 Leo-Breiman의 유명한 기사 Statistical Modeling : The Two Cultures (사용 가능한 공개 액세스) 에서 비롯됩니다 . 저자는 자신이보고있는 것을 데이터 분석에 대한 두 가지 다른 접근 방식으로 비교하고 고전 통계 및 기계 학습의 핵심 아이디어를 만집니다. 그러나이 기사는 의사 수준에서 통계를 추구했는지 또는 입문 과정을 밟았는지 여부에 관계없이 데이터를 다루는 사람이라면 누구나 이해할 수 있습니다. 또한, 기사는 자극적 이다. 즉, 같은 문제로 출판 된 일련의 활발한 논평에서 알 수 있듯이 쉽게 토론을 생성합니다.

이러한 특성을 가진 기사를 더 많이 찾고 싶습니다. 즉, 다음과 같은 기사입니다.

  • 통계 / 데이터 분석의 기본 개념에 대한 이해
  • 연구 중심의 변화와 공식적인 통계 훈련 측면에서 광범위한 청중이 이해할 수 있음
  • 통찰력 또는 논쟁을 통해 토론을 자극하십시오.

2
지금까지의 답변은 매우 흥미 롭습니다! 계속 오세요 물론, 나는 meta.stats.stackexchange.com/questions/409/…
Richard Border

2
통계 로가는 왕도 는 없습니다 .
Aksakal

답변:


15

Shmueli, Galit. "설명 또는 예측?" 통계 과학 (2010) : 289-310.

나는 그것이 당신의 세 가지 글 머리 기호와 일치한다고 생각합니다.

설명과 예측 모델링에 대해 설명하고 (용어는 설명이 필요함) 종종 차이점을 인식하지 못합니다.

모델링의 목표 (설명 대 예측)에 따라 다른 모델 구축 전략이 사용될 수 있고 다른 모델이 "최고의"모델로 선택 될 수 있다는 점을 지적합니다.

그것은 다소 포괄적 인 논문이며 즐거운 읽을 거리입니다. 이에 대한 논의는 Rob J. Hyndman의 블로그 게시물에 요약되어 있습니다. Cross Validated에 대한 관련 토론 이이 스레드에 있습니다 (공개가 많음). 같은 주제에 대한 또 다른 (답이없는) 질문은 this 입니다.


12

Lehmann, Erich L. "가설을 검정하는 Fisher, Neyman-Pearson 이론 : 하나의 이론 또는 두?" 미국 통계 협회 저널 88.424 (1993) : 1242-1249.

많은 사람들에게 알려지지 않았지만 직업의 거인들이 여전히 우리 사이에 있었을 때 그들은 서로 잘 지내지 못했습니다. 가설 검증의 기초에 대한 논쟁은 구체적으로 귀납적이든 연역적이든 어쨌든 피셔와 다른 한편으로는 네이 먼-피어슨 사이에서 꽤 심각한 모욕이 발생하는 것을 보았다. 그리고 그 문제는 일생 동안 해결되지 않았습니다.

그들이 모두 지나간 지 얼마되지 않아서 Lehmann은 그 격차를 해소하려고 노력하고 있으며, 제 생각에는 접근 방식이 상호 배타적이지 않고 보완 적이라는 것을 보여 주므로 좋은 일을합니다. 이것은 요즘 학생들이 배우는 것입니다. 가설 검정에 대한 몇 가지 기본 사항을 알아야하지만 문제없이 논문을 따를 수 있습니다.


1
인용 해 주셔서 감사합니다. 나는 한 번에 접근 F 및 NP의 주장 갈등에 대한 질문을했다 : stats.stackexchange.com/questions/112769을 많은 관심에도 불구하고, 그리고 내가 여전히 기존의 답변 중 하나로 확신하고 있지 않다받은 upvotes (그리고하지 않았다 수락). 나는 그 실로 돌아가서 읽기 / 바운티 또는 무언가를하려고하지만 시간을 찾지는 않을 것입니다. 만약 당신이 Lehmann의 논문에 익숙하다면 나는 거기에 답을하도록 격려 할 것입니다.
amoeba는 Reinstate Monica

@amoeba 나는 Lehmann의 논문을 몇 번이고 읽었으며 매우 읽을 만하지 만 그 문제를 당신만큼 철저히 조사한 것은 아니라고 생각합니다. 따라서 시간이있을 때마다 그것을 살펴보고 그의 관점을 보는 것이 좋습니다. Behrens-Fisher 문제에 대한 논의가 특히 밝혀졌습니다.
JohnK

공유해 주셔서 감사합니다. 어쩌면 내가 들었던 모든 것이 일방적이었을 것입니다. 그러나 론 피셔 경에 관해 들었던 모든 것은 그가 다루기에는 다소 불쾌한 사람이라는 것입니다. 그는 또한 담배 사용과 폐암 사이의 연관성대해 의문의 여지가 있었다 .
Phil

이 기사의 "가벼운"대안은 Christensen, Ronald입니다. "피셔, 네이 먼, 피어슨 및 베이 즈 테스트." 미국 통계 학자 59.2 (2005) : 121-126. 나는 그것이 즐거운 것을 알았다.
Richard Hardy

9

Wilk, MB 및 Gnanadesikan, R. 1968. 데이터 분석을위한 확률 플로팅 방법. Biometrika 55 : 1-17. 액세스 권한이있는 경우 Jstor 링크

이 논문은 필자가 쓴 시점에서 거의 50 년이되었지만 여전히 신선하고 혁신적인 느낌을줍니다. 다양하고 흥미롭고 실질적인 예제를 사용하여 저자는 QQ (quantile-quantile) 및 PP (probability-probability) 플롯의 프레임 워크를 사용하여 분포를 플로팅하고 비교하기위한 다양한 아이디어를 통합하고 확장합니다. 여기서 분포는 광범위하게 분석에서 발생하는 모든 데이터 세트 또는 숫자 (잔여 물, 대비 등)를 의미합니다.

이 도표의 특정 버전은 수십 년 전으로 거슬러 올라갑니다. 이러한 용어들에서 양자 양자 그래프, 즉 정규 (가우시안) 분포로부터 동일한 크기의 샘플로부터의 관측 된 양자 또는 예상 또는 이론적 양자의 도표이다. 그러나 저자들은 다른 종류의 Quantile을 검사하고 결과를 자동으로 플롯하기 위해 동일한 아이디어가 현대 컴퓨팅을 통해 쉽고 실질적으로 확장 될 수 있음을 보여줍니다.

Bell Telephone Laboratories의 저자들은 최첨단 컴퓨팅 시설을 즐겼으며 심지어 많은 대학과 연구 기관에서도 10 년 정도 걸렸습니다. 지금도이 백서의 아이디어는 적용 할 수있는 것보다 더 넓은 적용이 필요합니다. 일반적인 QQ 플롯 이외의 아이디어를 포함하는 드문 입문 텍스트 또는 코스입니다. 히스토그램 및 상자 그림 (각각 매우 유용하지만 그럼에도 불구하고 각 방법이 어색하고 여러 방법으로 제한됨)은 분포 그림이 도입 될 때 주요 주요 요소입니다.

개인적으로이 백서의 주요 아이디어는 대부분의 경력에 ​​익숙했지만 2 년마다 다시 읽습니다. 한 가지 좋은 이유는 저자가 간단한 예제를 통해 효과를 발휘할 수있는 단순하지만 강력한 아이디어를 만들어내는 방식에 대한 즐거움입니다. 또 다른 좋은 이유는 간결하게 쓰여진 논문이 약간의 폭격 흔적없이 주요 아이디어의 확장을 암시하는 방식입니다. 한 번 이상, 나는 측면 힌트와 추가 의견으로 명시 적으로 다루어 진 주요 아이디어에 대한 왜곡을 재발견했습니다.

이것은 통계 그래픽에 관심이있는 사람들을위한 논문이 아닙니다. 제 생각에는 모든 종류의 통계에 관심이있는 모든 사람들이 포함되어야합니다. 통계 능력과 통찰력을 개발하는 데 실질적으로 도움이되는 분포에 대한 사고 방식을 장려합니다.


2
이것은 훌륭한 선택입니다. 나는 이것을 여러 번 읽었습니다-당신의 답변에서 저자의 이름을 보자 마자 나는 이것이 어떤 종이인지 알았고 곧바로 다시 읽고 싶었습니다. 여기 어딘가에 사본이 있다고 생각합니다.
Glen_b-복지국 Monica

6

Ioannidis, John PA "가장 많이 발표 된 연구 결과가 거짓 인 이유" PLoS Medicine (2005)

Ioannidis, John PA "더 많은 출판 된 연구를 실현하는 방법" PLoS Medicine (2014)

연구에서 통계를 잘못 사용하고 해석하는 위험을 피하고자하는 모든 연구원 / 통계 / 분석가는 반드시 읽어야합니다. 2005 년 기사는 공공 과학 도서관의 역사에서 가장 많이 다루어졌으며 많은 논란과 토론을 자극했다.


6

Tukey에, JW (1960) 의사 결정의 대 결론 Technometrics 2 (4) : 423-433

이 문서는 Tukey의 저녁 식사 후 대화를 기반으로하며 '상당한 토론이 이어졌다'는 의견이있어 적어도 점의 3 분의 1에 해당합니다.

공학 박사 학위를 수료 할 때이 논문을 처음 읽었으며 데이터 분석의 실용성에 대한 탐구를 높이 평가했습니다.


링크가 작동하지 않습니다. 이것은 작동합니다
kjetil b halvorsen


3

로이 모델에 대한 관심이 경제학자들 사이에서 더 큰 관심을 받고 있음에도 불구하고 (그러나 나는 틀릴 수도 있음), 1951 년 논문 "소득 분배에 대한 몇 가지 생각" 은 자기 선택 문제에 대한 통찰력과 비 기술적 토론입니다. 이 논문은 노벨상 James Heckman이 개발 한 선택 모델에 영감을주었습니다. 오래되었지만 세 가지 요점과 일치한다고 생각합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.