어려운 통계 개념에 대해 가장 좋아하는 평신도의 설명은 무엇입니까?


36

복잡한 문제에 대한 간단한 설명을 듣는 것이 정말 좋습니다. 어려운 통계 개념을 설명하는 가장 좋아하는 유추 나 일화는 무엇입니까?

내가 가장 좋아하는 것은 술취한 개와 그녀의 개를 이용한 머레이의 설명이다. 머레이는 두 가지 무작위 과정 (방랑하는 음주와 그녀의 개, 올리버)이 어떻게 단위근을 가질 수는 있지만, 그들의 첫 번째 차이가 고정되어 있기 때문에 여전히 관련 (공적분) 될 수 있는지 설명합니다.

술 취한 사람은 술집에서 출발하여 무작위로 걷는 방식으로 목표없이 방황합니다. 그러나 그녀는 주기적으로 "올리버, 어디 있니?" 그는 그녀의 말을 듣습니다. 그녀는 그를 듣는다. 그는 "아, 나는 그녀를 너무 멀리 내버려 둘 수 없다. 그녀는 "아, 나는 그를 너무 멀리 내버려 둘 수 없다. 그는 한밤중에 짖는 소리로 나를 깨울 것이다." 각각은 상대방이 얼마나 멀리 떨어져 있는지 평가하고 그 격차를 부분적으로 닫으려고 움직입니다.

답변:


18

p 값은 데이터를 난처하게 만드는 귀무 가설에 대한 척도입니다.

Nicholas Maxwell, 데이터 문제 : 무작위 세계에 대한 개념적 통계 Emeryville CA : Key College Publishing, 2004.


15
  1. 분포 (히스토그램)를 목재로 조각하고 손가락으로 균형을 잡으려고하면 분포의 모양에 관계없이 균형점이 평균이됩니다.

  2. 산점도 중간에 막대를 넣고 스프링을 사용하여 각 데이터 점에 막대를 부착하면 막대의 정지 점이 회귀선이됩니다. [1]

[1] 이것은 기술적으로 주요 구성 요소 회귀입니다. 스프링을 "수직으로"최소 제곱으로 만 움직 이도록 강요해야하지만 예제는 어느 쪽이든 예시입니다.


2
스프링 력은 변형에 비례하므로 최소 제곱 회귀가 아닙니다!
shabbychef

1
좋은 시도! 봄에 따라 다릅니다. 예를 들어, 스프링 상수가 1 / 시그마이면 훌륭하게 작동합니다.)
Neil McGuigan

2
아니, 아니, 요점은 정적 평형에서 힘의 합은 0이 될 것입니다. 동일한 스프링 상수를 가정하면 절대 편차, 즉 회귀, 최소 제곱 의 합계를 최소화하게 됩니다. 이것은 스프링이 스틱에 자유롭게 떠 있어야한다는 사실을 무시하므로 변형이 전체적으로 방향 이 아니므로 주성분이 맞지만 절대 오차가 발생 하도록 변형 됩니다. L1y
shabbychef

@shabbychef : 변형에 비례하는 스프링 력은 스프링 에너지가 변형 제곱에 비례 함을 의미합니다. 스프링 에너지는 실제로 평형에서 최소화되는 것입니다. 힘의 합이 0이 아니거나 이 최소화 되지 않습니다 . 은 절대 값의 합계를 최소화합니다. L 1L1L1
wnoise

12

나는 이전에 술 취한 사람의 산책을 무작위로 걸었고, 술에 취한 사람과 그녀의 개를 함께 사용했습니다. 그들은 매우 유용합니다 (부분적으로 재미 있기 때문에).

내가 가장 좋아하는 일반적인 예 중 하나는 생일 패러독스 ( wikipedia entry )인데, 몇 가지 중요한 확률 개념을 보여줍니다. 사람들로 가득 찬 방에서 이것을 시뮬레이션 할 수 있습니다.

또한 통계 개념을 가르치는 창의적인 방법에 대한 예제는 Andrew Gelman의 "Teaching Statistics : A Bag of Tricks" 를 강력히 권장 합니다 (목차 참조 ). 또한 그가 교수 통계에 대해 가르치는 과정에 대한 그의 논문을보십시오 : "대학 수준의 교수 통계에 관한 과정" . 그리고에 "정치학, 사회학, 보건, 교육, 경제학 대학원 학생에 대한 교육 베이 즈, ..." .

베이지안 방법을 설명 할 때 불공평 한 동전을 사용하고 여러 번 뒤집는 것은 매우 일반적이고 효과적인 방법입니다.


1
Tim

11

나는 "동급"실습을 통해 표본 변동과 본질적으로 중심 한계 정리를 보여주고 싶습니다. 수업 시간에 100 명 정도의 학생들은 자신의 나이를 종이에 씁니다. 평균을 계산 한 후 모든 용지 조각이 같은 크기이고 같은 방식으로 접 힙니다. 이것은 인구이며 평균 연령을 계산합니다. 그런 다음 각 학생은 무작위로 10 장의 종이를 선택하고 나이를 기록하고 가방에 반환합니다. (S) 그는 평균을 계산하고 가방을 다음 학생에게 전달합니다. 결국 우리는 각 인구 평균을 추정하는 10 명의 학생들로 구성된 100 개의 표본이 히스토그램 및 일부 기술 통계량을 통해 설명 할 수 있습니다.

우리는 이번 여론 조사에서 몇 가지 예 / 아니오 질문을 모방 한 100 개의 "의견"을 사용하여 이번 시위를 반복합니다. 예를 들어 (영국 총선) 선거가 내일 소집되면 영국 국회에 투표하는 것을 고려해보십시오. 학생들은이 의견 중 10 개를 추출합니다.

마지막으로 연속 및 이진 데이터를 사용하여 샘플링 변동, 중앙 제한 정리 등을 시연했습니다.


10

1
+1 그 문제는 처음 읽고 그것에 대해 생각했을 때 내 뇌를 비 틀었습니다. 그리고 해결책은 매우 간단하지만 확률에 대해 많이 가르칩니다.
Sharpie

1
나는 Monty Hall 문제가 단순한 평신도의 가능성에 대한 설명에 지나지 않는다는 것을 알았습니다. 나는 그것을 이해하지만 여전히 내 머리를 감싸는 데 어려움을 겪고 있지만 통계가 아닌 사람에게 설명하고 그것을 배우는 데 충분히 이해하는 것은 물론입니다 ... 어쨌든, 당신은 문제의 여부를 지정하지 않습니다 당신이다 어려운 개념 , 또는 평신도의 설명 . 할 때까지 -1
naught101

2
Monty Hall 문제를 설명하는 쉬운 방법은 같은 문제를 상상하는 것입니다. 그러나 1000 개의 문으로 999 개 중 뒤에 염소가 있고 그 중 1 대만 뒤에 차가 있습니다. 문을 선택하면 게임 쇼 주최자가 998 개의 다른 문을 열고 자신이 열지 않은 한 문으로 결정을 변경할지 묻습니다. 그는 뒤에 차 문을 열었다 수 없음을 알고, 당신은 것 다른 문 스위치 (또는 당신이 바로 초기의 선택에 있다고 터무니 확신 할 수).
Berk U.

10

1) 특정 사건의 확률을 계산하기 위해 "무작위"를 어떻게 정의해야하는지에 대한 좋은 설명 :

원을 가로 질러 그려진 임의의 선이 반지름보다 길 확률은 얼마입니까?

문제는 전적으로 선을 그리는 방법에 달려 있습니다. 지상에 그려진 원에 대해 실제 방식으로 설명 할 수있는 가능성은 다음과 같습니다.

원 안에 임의의 두 점을 그리고이를 통해 선을 그립니다. (두 파리 / 돌이 떨어지는 곳을보십시오 ...)

원주에서 고정 점을 선택한 다음 원의 다른 곳에서 임의의 점을 선택하고 결합하십시오. (실제로 이것은 주어진 지점과 돌이 떨어지는 임의의 지점을 통해 가변 각도로 원을 가로 질러 막대기를 놓는 것입니다.)

직경을 그립니다. 무작위로 점을 선택하고 그 점을 수직으로 그립니다. (스틱을 직선을 따라 구르면 원을 가로 질러 놓입니다.)

지오메트리를 수행 할 수있는 사람 (통계는 아님)을 나타내는 사람은 질문에 대한 답변이 상당히 광범위 할 수 있음 (약 2/3에서 약 0.866 정도)을 나타내는 것이 상대적으로 쉽습니다.

2) 리버스 엔지니어링 동전 던지기 : 10 번 던지고 결과를 기록하십시오. 이 정확한 시퀀스 의 확률을 계산하십시오 . 작은 기회이지만, 당신은 방금 자신의 눈으로 일어나는 것을 보았습니다! ... 열 개의 머리를 포함하여 모든 시퀀스 가 나타날 수 있지만, 평신도 사람들이 머리를 감는 것은 어렵습니다. 앙코르로서 다른 조합과 마찬가지로 1에서 6까지의 복권 당첨 확률이 높다고 확신 시키십시오.(1210)

3) 의학적 진단이 실제로 결함이있는 이유를 설명합니다. 질병 foo에 대한 테스트는 99.9 %의 정확성을 보였지만 .1 %는 실제로 그렇지 않은 사람들을 거짓 양성으로 진단하여 질병의 유병률이 매우 낮을 때 실제로 너무 자주 잘못 보일 수 있습니다. 예를 들어 1000 명 중 1 명), 많은 환자들이 검사를받습니다.

이것은 실제 숫자로 가장 잘 설명되는 것입니다-백만 명의 사람들이 테스트를 받았고 1000 명이 질병에 걸렸고 999가 올바르게 식별되었지만 999,000의 0.1 %는 999가 있지만 999가 아니라고 말합니다. 따라서 높은 수준의 정확성 (99.9 %)과 낮은 수준의 오 탐지율 (0.1 %)에도 불구하고 실제로 말한 사람들의 절반은 실제로 그렇지 않습니다. 두 번째 (이상적으로 다른) 테스트는 이러한 그룹을 분리합니다.

[실수로, 나는 숫자가 작업하기 쉽기 때문에 선택했습니다. 물론 정확도 / 가양 성 비율은 테스트에서 독립적 인 요인이므로 최대 100 %를 더할 필요는 없습니다.]


2
첫 번째 예는 Bertrand의 역설을 참조한다고 생각합니다. 확률 적 공간을 정의하는 다른 방법의 아주 좋은 그림!
chl

9

Sam Savage의 책 Flaw of Averages 는 통계 개념에 대한 평신도의 설명으로 가득 차 있습니다. 특히 젠슨의 불평등에 대해 잘 설명하고있다. 투자 수익률 그래프가 볼록한 경우 (예 : "스마일 미소") 임의성이 선호됩니다. 평균 수익률이 평균 수익률보다 큽니다.



6

Behar et al은 통계를 가르치기위한 25 개의 유추 모음을 가지고 있습니다. 다음은 두 가지 예입니다.

2.9 모든 모델은 이론적이다 : 우주에는 완벽한 구체가 없다 우주에서 가장 일반적인 기하학적 형태는 구체 인 것으로 보인다. 그러나 우주에는 수학적으로 완벽한 구체가 몇 개 있습니까? 답은 없습니다. 지구 나 태양, 당구 공 모두 완벽한 구체는 아닙니다. 따라서 실제 구가 없다면 구의 면적이나 부피를 확인하는 공식은 무엇입니까? 따라서 일반적으로 통계 모델, 특히 정규 분포를 사용합니다. 가장 일반적인 예 중 하나는 높이 분포이지만 지구상의 모든 성인의 키를 처분 할 수 있다면 히스토그램 프로파일은 데이터가 성별에 의해 계층화되지 않더라도 가우스 종 곡선에 해당하지 않습니다. 인종 또는 기타 특성.

2.25 잔차에 정보가 포함되지 않아야 함 : 쓰레기 봉지 잔차는 데이터에서 모든 정보를 제거한 후 남은 것입니다. 그들은 정보를 가지고 있지 않기 때문에 우리는 그것들을“쓰레기통”으로 간주합니다. 우리는 가치가있는 (쓰레기통) 쓰레기를 버리지 말고 종속 변수의 행동을 더 잘 설명하기 위해 이용 될 수 있도록해야합니다.

다른 예로는

  • "처리 비교에 대한 샘플 크기의 영향 : 쌍안경의 확대"
  • "인구 크기에 따른 표본 크기 : 수프 시음 용 숟가락"

참고 문헌

  • Behar, R., Grima, P. & Marco-Almagro, L. (2012). 통계 개념을 설명하기위한 25 가지 유추. 미국 통계 학자.

3

재미있는 질문입니다.

누군가 내가 생물 통계학에서 일한다는 것을 알았고 그들은 (기본적으로) "통계가 거짓말하는 방법이 아닌가?"

(거짓 거짓말, 망할 거짓말, 통계에 관한 Mark Twain 인용문을 다시 가져옵니다.)

통계를 통해 가정과 데이터가 주어 졌을 때 그러한 확률이 정확히 그런 확률이라는 100 % 정밀도로 말할 수 있다고 설명했습니다.

그녀는 감동하지 않았습니다.


1
"100 %의 정밀도로 정확히 우리의 정밀도 부족이 얼마나 큰지 말할 수 있습니다"
naught101

@Jeromy의 대답은 명백한 반박이 아니라면 왜 "100 % 정밀도"개념을 폐기해야하는지 제안합니다.
rolando2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.