회의적이지만 수학을 싫어하는 독자를위한 추론


14

방금 통계 온라인 코스 소개의 일부인 통계적 추론 ( "비율과 평균 비교")에 대한 강의를 보았습니다. 자료는 항상 그렇듯이 나에게 의미가 없었습니다. (지금까지 나는이 물건들을 수십 번 보았을 것입니다.

나는 회의 론적 독자를 설득하는 문제를 심각하게 다루는 "기본 통계 -101"(점 추정, 추정 평가, 통계적 추론, 가설 검정, 연구 설계)에 관한 책을 찾고 있습니다.

아래에서 나는 내가 찾은 저자가 진지하게 받아들이고 설득력있게 다룰 방법을 알고있는 질문 유형 의 몇 가지 예를 제시합니다 .

그러나 먼저이 게시물에서 나는 이러한 질문을하지 않는다는 것을 강조하기 위해 잠시 시간을내어 보도록하겠습니다 . 그들에게 대답하지 마십시오! 나는 단지 예로써, 그리고 "리트머스 테스트"(검색 저자의 유형을 위해)를 제공합니다.

  1. "비례"가 단순히 부울 변수 의 평균 인 경우 (즉, 값 0과 1 만 사용하는 변수) "비례"와 "평균"을 사용하여 통계적 추론을 수행하기 위해 다른 절차를 배우는 이유는 무엇입니까?

  2. 정규 분포가 너무 강력하여 데이터가 정규 분포가 아닌 경우에도 정규성을 가정하면 좋은 결과를 얻을 수 있고 t 분포가 너무 정상적인 경우 t- 분포 대신 t 분포를 사용하는 것에 대한 모든 소란이 왜 표준?

  3. "자유도" 란 정확히 무엇 이며 왜 우리는 그들에 대해 걱정합니까?

  4. 데이터와 유사하게 보이는 분포 만 사용한다는 점을 고려하여 모수의 "참"값을 말하는 것은 무엇을 의미 합니까?

  5. "탐색 데이터 분석"은 어떻게 좋은 것이며 "데이터 스누핑"은 나쁜 것입니까?

내가 말했듯이, 나는 태도에 의해 연기 그러한 질문을 무시함으로써 암시되는 . 나에게 무언가를 가르치는 사람에게서보고 싶은 것은 "윤리적 입장"이 아닙니다. 나는 독자들의 회의론과 합리성을 존중하고, 그것들을 다루는 방법을 알고있는 작가를 찾고있다 (필수 페이지와 형식의 기술과 기술로 넘어 가지 않아도된다).

나는 이것이 큰 주문이며 특히 통계와 관련하여 특히 그렇다는 것을 알고 있습니다. 따라서 많은 저자가 성공했을 것이라고는 생각하지 않습니다. 그러나 현재 나는 단지 하나 를 찾는 것에 만족할 입니다.

내가 수학을 싫어한다는 것을 덧붙여 봅시다. 반대로 나는 수학을 좋아합니다. (나는 분석 [일명 "고급 미적분학"], 선형 대수, 확률 이론, 심지어 기본 측정 이론에도 익숙합니다.)

즉, 현재 나의 관심은 "이론적", "실제", "매일", "실제"통계 (이론적 장점과 반대되는)에있다. (그러나 나는 요리 책도 원하지 않는다!)

FWIW, Gelman과 Hill의 회귀 및 다중 레벨 / 계층 모델사용하여 데이터 분석 의 처음 몇 장을 읽었 으며 저자의 의견을 좋아합니다. 그들의 초점은 실용적이지만 필요한 경우 이론으로 이동하십시오. 또한 종종 물러서서 표준 관행을 비판적으로 평가하고 회의론자의 상식에 호소하는 솔직한 의견을 제시합니다. 불행하게도,이 저자들은 내가이 포스트에서 요구하고있는 주제 (위에 설명 된 "Stats 101")에 관한 책을 쓰지 않았습니다. 또한이 저자 중 한 명 (Gelman)이 유명한 Bayesian 데이터 분석을 공동 저술했음을 알고 있습니다 . 그러나 다시 한 번 이것은 제가 찾고있는 것이 아닙니다.

편집하다:

Dikran Marsupial은 다음과 같은 이의를 제기합니다.

필자는 질문을 무시하는 데 반드시 잘못된 것이 있다고 생각하지 않으며, 모든 질문을 다루는 것이 종종 더 중요한 기본 개념의 설명에서 벗어나는 지점이 있습니다 (특히 통계 101 책!).

동의합니다. 내가 "기본 통계에 대한 두 번째 모습"을 찾고 있다고 말하는 것이 더 정확할 것입니다. 사실 저는 이것을 동기 부여로 대학원 과정에서 추론에 사용 된 교과서를 보았고, 제가 열거 한 것과 같은 질문 을 너무 소홀히 하는 것을 발견했습니다 . 어쨌든, 그들은 그러한 질문들을 탐구하는 경향이 적어졌습니다 (따라서 그들은 수렴 또는 다른 것의 조건과 같은 문제에 집중할 수 있습니다 ...).

문제는 더 진보 된 책들이 "외부인의 회의론"이 급격히 고갈 된 독자 들과는 완전히 다른 독자들을 대상으로한다는 점이다. IOW, 대학원 수준의 통계를받는 사람들은 나를 귀찮게하는 질문으로 인해 방해받는 시점을 지났습니다.. 그들은 더 이상이 물건에 대해 회의적이지 않습니다. (그들은 어떻게 회의 론적 혹을 극복 했는가? 어쩌면 일부 사람들은 처음부터 통계를 상당히 일찍 알게되었을 때 너무 비판적이지 않았을 것입니다. 다른 사람들에게는 교과서가 부족한 곳에 채워진 교사가 있었을 수도 있고, 어떤 사람들은 그러한 질문에 대한 답을 스스로 알아낼 수있을만큼 영리했을 수도 있습니다.)


2
우리가 대답하지 않은 질문들 대부분은 이미 이력서에 대한 좋은 답변을 가지고 있습니다. 그러한 질문들 중 일부는 심지어 사소한 대답을 가지고 있습니다. 그러나 어떤 주제 동안 사람들이 가지고 올 천 질문이 - 당신은 결코 커버 가능한 모든 질문은, 어느 쪽도 아니 당신은 그냥 그냥 특정 질문에 예상 하나를 찾을 수 없다는 것을 설명 찾을 않을거야 당신이 보고있는 동안이 또는 독서. 글쎄, 당신은 우연히 하나 나 둘을 칠 수도 있지만 전반적으로 불가능한 표준입니다. 왜 질문이 생길 때 물어 보지 않겠습니까? 질문에 대답하는 사이트에서?
Glen_b-복지 주 모니카

2
사람들이 통계를 할 때 비슷한 질문이 나오고 (일부 책은 그 중 일부에 답할 수 있음) 말할 것입니다. 그러나 대부분은 회의론과 관련된 실제 질문이 아닙니다. 대부분 간단한 이해 질문입니다. 예를 들어 "자유도는 무엇이며 왜 우리를 돌봐야 하는가"는 전혀 회의적이지 않으며, 설명과 동기 부여의 명확성을 요구합니다. 통계의 고급 사용자가 걱정하지 않는 이유는 이미 가치가있는 이유를 이미 이해했기 때문입니다.
Glen_b-복지 주 모니카

답변:


6

이미 좋은 제안을 받았습니다. 몇 가지 더 있습니다. 먼저, 산발적으로 읽은 두 블로그와 자신과 같은 질문이있는 경우가 가끔 논의됩니다. 그들은 블로그이기 때문에 질문을하고 아주 좋은 답변을 얻을 수도 있습니다! 여기에 그들이 온다 :

http://andrewgelman.com/ (앤드류 겔맨)

http://errorstatistics.com/ (Deborah Mayo)

Box, Hunter & Hunter : 실험자에 대한 통계입니다.

제목에서 알 수 있듯이, 이것은 자신의 실험을 디자인하고 분석하려는 사람들을위한 ( "첫번째", 그러나 실제로는 ... 두 번째) 코스입니다. "왜"부분에서 매우 높습니다.

콕스 박사 : 통계적 추론의 원리, "어떻게"가 아니라 "어떻게"에 관한 아주 좋은 책.

평균과 비율이 다르게 취급되는 이유를 묻기 때문에 여기에 해당되지 않는 책이 있습니다. http://www.amazon.com/Statistics-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = books & ie = UTF8 & qid = 1373395118 & sr = 1-1 & keywords = freedman + statistics

수학은 낮고 원칙은 높았습니다.


8

개별 사람들이 다른 것들에 대해 회의적인 경향이 있고 책이 개인보다는 대상 독자를 위해 쓰여짐에 따라 귀하에게 적합한 단일 책이 있는지 의심합니다. 이것은 책이 아니라 사람이 가르치는 것에 대한 좋은 점 중 하나입니다. 이것은 선형 텍스트에서 수행하기가 매우 어렵습니다.

필자는 질문을 무시하는 데 반드시 잘못된 것이 있다고 생각하지 않으며, 모든 질문을 다루는 것이 종종 더 중요한 기본 개념의 설명에서 벗어나는 지점이 있습니다 (특히 통계 101 책!).

가장 좋은 방법은 좋은 책을 구한 다음 다른 곳에서 답변되지 않은 질문에 대한 답을 찾는 것입니다. 필자 앞에는 통계 텍스트로 가득 찬 책장이 있는데, 그 중 어느 것도 내가 필요로하는 것 (Jaynes의 책; o)이 아니기 때문이다.

절대 초보자에게는 Grant Foster의 저서 "통계 이해하기" 가 시작하기에 좋은 곳이라고 생각하지만,이 경우에는 너무 기초적이라고 생각합니다.


1
"질문을 무시하는 데 반드시 잘못된 것이 있다고 생각하지 않습니다 ..."나는 이것이 공정한 반대라고 생각합니다. 내 게시물에 EDIT을 추가하여 해결했습니다.
kjo

7

주제에 대해 근본적으로 다른 경로를 시도하십시오. Anders Hald의 "수학 통계의 역사 (1750 년에서 1930 년까지)"를 얻고 우리의 주제의 역사에 대해 배우십시오. 통계 모델 개념의 느린 출현을 파악하면 질문이 사소 해 보일 것입니다. 통계 모델의 두 가지 부분을 명확하게 이해해야합니다. 관찰 가능한 데이터엑스 관찰 할 수없는 매개 변수 Θ. 샘플링 분포엑스Θ 가정하고 우리의 목표는 Θ 주어진 가치 엑스. 몇 가지 질문을 살펴보면 : 1) 다른 모델; 2) 분포는 특정 통계량 (데이터의 함수)의 샘플링 분포입니다. 엑스) 데이터가 정상일 때 3) 자유도는 다음의 값이Θ소위 귀무 가설에 의해 제한됩니다. 또한 알려진 추론 문제 (예 : 분산이 알려진 일반 데이터)를 선택하여 고전적 방법과 베이지안 방식으로 해결하십시오. 차이점을 대조하십시오. 조명일 수도 있습니다.


5
+1 통계 절차가 의심스러워 보이는 이유의 대부분은 반 직관적이기 때문에 통계가 그 방식대로 끝난 방식에 대한 역사적 인식이 회의론자에게 좋은 접근 방법 일 수 있기 때문입니다.
Dikran Marsupial

2
@DikranMarsupial : 사실, 나는 통계와 관련된 어려움의 맨 아래에 도달하기 위해 Stigler의 "통계 이력"을 정확하게 읽었습니다. 그리고 그것은 일부 도움이되었습니다. 불행히도, (심지어) 많은 이상한 기괴함이 일어 났을 때 피셔 대 네이 먼 시대의 대부분을 배제합니다. 나는 Hald의 책의 약 50 페이지를 시도했지만 그의 추론이 따르기가 불가능하다는 것을 발견했습니다. 그들은 상당한 통계적 전문 지식을 가진 독자들에게 명확하게 언급되었습니다 ... 생각해보십시오. 통계가 너무 이상합니까? " 잘 팔 것이다 ... :)
kjo

4
IMHO 통계의 반 직관성은 피셔 vs 네이 먼 시대 이전입니다 (직관성이 유용성 또는 그 반대의 의미는 아닙니다). 이안 해킹의 책은 시도해 볼만한 가치가 있습니다. Bayesian 통계는 잦은 통계보다 개념적으로 이해하기가 훨씬 쉽지만 실제로는 수행하기가 훨씬 어렵습니다. 베이지안과 잦은 접근 방식의 차이점을 이해하면 잦은 접근 방식을 이해하는 데 많은 도움이되었습니다.
Dikran Marsupial

1
감사합니다. 해킹을 확인하겠습니다. 그의 책은 오랫동안 내 시야에 있었지만 나는 확률 이론의 철학에 초점을 맞추고 있다고 생각했다. 즉, 통계 관련 문제 중 적어도 몇 가지가 확률의 해석에 영향을 미치므로 해킹을 읽으면 적어도 일부 이의 제기가 처리 될 것입니다.
kjo

2
@kjo 나는 해킹의 통계적 추론 논리를 읽고 매우 '철학적'이라는 것을 알았습니다. 그는 Neyman-Pearson의 '지원'과 다운 가능성에 대한 아이디어에 올라갔지 만 간단한 예를 들었습니다. -파라미터 추론, 또는 까다로운 것 (내가 잊어 버리지 않는 한). 확실히 읽을만한 가치가 있지만 시작하는 것은 좋지 않습니다.
Scortchi-Monica Monica 복원

6

Abelson (1995), 주요 논증으로서의 통계 는 입문 적이며 종종 학습자들을 혼란스럽게하는 몇 가지 질문을 흥미롭게 받아들입니다.

그러나 아마도 당신은 이론적 통계에 관한 책을 읽어야 할 것입니다 (수렴, 미터법 공간 등). 그리고 그들이 당신의 예제와 같은 구체적인 질문에 대답하지 않더라도 대부분의 대답을 할 수 있습니다 @Dikran이 제안한대로 나머지 부분을 찾아보십시오.

나는 콕스 & 힝 클리, 읽기, 다른 스레드에서 제안 된 이론 통계 또는 콕스, 통계 추론의 원칙 Casella & 버거와 함께 통계 추론을 이 생길 수있는 다양한 관점의 이해를 얻을 수 있습니다.


1
나는 그것이 흥미로 웠지만 OP가 기대하는 수준에 있다고 생각하지 않습니다.
Gala

@Gael 특히 편집의 관점에서봤을 것입니다.
Scortchi-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.