시험 점수가 실제로 정규 분포를 따르고 있습니까?


14

GLM에서 사용할 배포판을 배우려고 노력했으며 정규 배포판을 사용할 때 약간 혼란 스러웠습니다. 교과서의 한 부분에서 정규 분포가 시험 점수를 모델링하는 데 좋을 수 있다고 말합니다. 다음 부분에서는 자동차 보험 청구를 모델링하는 데 어떤 분포가 적합한 지 묻습니다. 이번에는 적절한 분포가 양수 값으로 만 연속적이므로 감마 또는 역 가우스가 될 것이라고 말했다. 시험 점수도 긍정적 인 값으로 만 지속될 것이라고 생각합니다. 왜 정규 분포를 사용합니까? 정규 분포가 음수 값을 허용하지 않습니까?


1
점수에 대한 경계가 걱정된다면 en.wikipedia.org/wiki/Truncated_normal_distribution
JG

6
물론 실제 환경에서 시험 점수 분포는 보통 정규 분포처럼 보이지 않습니다. 수학 학부 시절의 예로써, 나는 토폴로지 I 클래스가 매우 이봉적인 "덤벨 커브"등급 분포로 악명 높은 것으로 기억합니다 . 핵심 개념을 이해하고 거의 완벽한 점수를 얻었거나 그렇지 않은 경우 운이 좋은 점은 전혀 없습니다. 이 두 극단 사이의 중간에있는 사람은 거의 없었습니다.
Ilmari Karonen

2
아니요. 다음 질문입니다.
Carl Witthoft

답변:


14

예를 들어, 높이는 종종 정상적인 것으로 모델링됩니다. 어쩌면 남성의 키는 표준 편차가 2 인치 인 5 피트 10 정도입니다. 우리는 음의 높이가 물리적이지 않다는 것을 알고 있지만,이 모델에서 음의 높이를 관찰 할 확률은 본질적으로 0입니다. 우리는 어쨌든 충분히 근사하기 때문에 모델을 사용합니다.

모든 모델이 잘못되었습니다. 문제는 "이 모델은 여전히 ​​유용 할 수 있는가?"이며, 높이 및 테스트 점수와 같은 것을 모델링하는 경우 기술적으로 비 물리적 인 것을 허용하더라도 현상을 정상으로 모델링하는 것이 유용합니다.


이 특별한 경우에는 정규 분포가 유용한 근사치 인지 의심 됩니다. 내가 본 거의 모든 등급 분포는 코멘트에서 언급 한 바이 모달 곡선 Ilmari Karonen과 어느 정도 비슷했습니다. (일반적으로 극단적 인 모드가 아닌 0.6과 0.9의 모드를 사용하지만) 서로 다른 평균을 갖는 정규 분포 의 선형 조합은 나쁜 근사치가 아닙니다.
Ray

나는 정상이 BEST 근사치라고 주장하지 않았습니다. 내 의견의 전체 요점은 실제로 마지막 단락에서 이루어집니다. 최소한이 추상화 수준에서 실제 등급 분포의 이중성에 대한 의견은 실제로 도움이되지 않습니다.
Demetri Pananos

나는 당신이 당신의 대답에서 말한 모든 것에 동의하지만, 질문의 일부는 정규 분포가 특히 등급 분포 모델링에 적용 가능한지 여부와 관련이 있습니다. 그 대답은 보통 "아니오"입니다. 모든 모델이 잘못되었고 일부 모델이 유용하지만 일부 모델은 다른 모델보다 더 잘못되고 덜 유용합니다. 특히 정규 분포는이 문제에 대한 특히 나쁜 적합 있다는 사실은 중요하며, 그것이 같은 대답은 정상이 제안하는 것 같다 실제로는 훨씬 더 깊은 문제가있을 때, 꼬리가 부정적인 무한 이동하기 때문에 잘못.
Ray

당신은 여기에 약간 놀랍습니다. OP의 문제는 정상이 음수 점수를 허용한다는 것입니다. Bimodality는 문제가되지 않았습니다. 이 질문과 관련하여 나무의 숲을 보지 못하고 있습니다. 모델링 세부 사항은 현재 관련이 없습니다.
Demetri Pananos

10

정규 분포가 음수 값을 허용하지 않습니까?

옳은. 상한도 없습니다.

교과서의 한 부분에서 정규 분포가 시험 점수를 모델링하는 데 좋을 수 있다고 말합니다.

그럼에도 불구하고, 이전의 진술에도 불구하고 때때로 그런 경우가 있습니다. 테스트 할 구성 요소가 많거나 너무 강하지 않은 경우 (예 : 본질적으로 수십 번 동일한 질문이 아니거나 각 부분이 이전 부분에 대한 정답을 요구하지 않음) 매우 쉽고 어렵지 않은 경우 ( 따라서 대부분의 마크는 중간 부근에 위치합니다. 그런 다음 마크는 보통 정규 분포에 의해 합리적으로 잘 추정 될 수 있습니다. 일반적인 분석이 거의 문제를 일으키지 않을 정도로 충분합니다.

우리는 그것이 정상적이지 않다는 것을 확실히 알고 있지만, 우리가 사용하는 절차의 행동이 우리의 목적에 맞아야하는 정도 (예 : 표준 오차, 신뢰 구간, 유의 수준)에 가깝다면 자동적으로 문제 가되지는 않습니다. 그리고 힘-필요한 것-우리가 기대하는 것에 가까이하십시오)

다음 부분에서는 자동차 보험 청구를 모델링하는 데 어떤 분포가 적합한 지 묻습니다. 이번에는 적절한 분포가 양수 값으로 만 연속적이므로 감마 또는 역 가우스가 될 것이라고 말했다.

그렇습니다. 그러나 그 이상은 크게 왜곡되는 경향이 있으며 평균이 커지면 변동성이 증가하는 경향이 있습니다.

차량 클레임에 대한 클레임 크기 분포의 예는 다음과 같습니다.

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(Garrido, Genest & Schulz (2016)의 그림 5 : "보험 청구의 종속 주파수 및 심각도에 대한 일반화 된 선형 모델", 보험 : 수학 및 경제, Vol 70, 9 월, p205-215. https : //www.sciencedirect. com / science / article / pii / S0167668715303358 )

이것은 전형적인 오른쪽으로 치우침과 두꺼운 오른쪽 꼬리를 보여줍니다. 그러나 이것은 한계 분포이기 때문에 매우 조심해야하며 조건부 분포에 대한 모델을 작성하고 있습니다 . 이는 일반적으로 훨씬 덜 치우칩니다 (임계 값을 혼합하여 클레임 크기의 히스토그램을 수행하는 경우 살펴 보는 한계 분포). 이러한 조건부 분포 중). 그럼에도 불구하고 예측 변수의 하위 그룹 (아마도 연속 변수 분류)에서 클레임 크기를 보면 분포가 여전히 매우 오른쪽으로 치우치고 오른쪽에 상당히 짙은 꼬리표가 감마 모델과 같은 것을 제안하는 경우입니다. 가우스 모델보다 훨씬 더 적합합니다.

가우시안보다 더 적합한 다른 분포가있을 수 있습니다. 역 가우시안은 또 다른 선택입니다. 로그 정규 또는 Weibull 모델은 GLM이 아닌 상태에서도 유용 할 수 있습니다.

[이러한 분포가 거의 완벽한 묘사 인 경우는 드물다. 그것들은 부정확 한 근사치이지만, 분석이 유용하고 원하는 특성에 가까울 정도로 많은 경우에 충분합니다.]

시험 점수도 긍정적 인 값으로 만 지속될 것이라고 생각합니다. 왜 정규 분포를 사용합니까?

(앞서 언급 한 조건-너무 의존적이지 않고 어렵거나 쉽지 않은 많은 구성 요소)에서 분포는 대칭, 단봉 형 및 두꺼운 꼬리에 상당히 가깝습니다.


0

이항 분포로 시험 점수를 더 잘 모델링 할 수 있습니다. 매우 단순화 된 경우, 각각 1 점의 100 개의 참 / 거짓 질문이있을 수 있으므로 점수는 0과 100 사이의 정수가됩니다. 테스트 담당자의 문제와 문제의 정확성 사이의 상관 관계가 없다고 가정하는 경우 (의심스러운 가정) )에서 점수는 독립적 인 랜덤 변수의 합계이며 중앙 한계 정리가 적용됩니다. 질문 수가 증가함에 따라 올바른 문제의 일부가 정규 분포로 수렴됩니다.

0보다 작은 값에 대해 좋은 질문을합니다. 100 %보다 큰 값에 대해서도 같은 질문을 할 수 있습니다. 테스트 문제의 수가 증가함에 따라 합의 분산이 감소하므로 피크가 평균을 향해 끌어옵니다. 마찬가지로, 최적 적합 정규 분포는 분산이 더 작으며 [0, 1] 간격을 벗어난 pdf의 가중치는 항상 0이 아닌 경향이 있습니다. "fraction correct"의 가능한 값 사이의 간격도 줄어들 기 때문에 (100 개 질문의 경우 1/100, 1000 개 질문의 경우 1/1000 등) 비공식적으로 pdf는 점점 더 연속적인 pdf처럼 동작하기 시작합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.