정규 분포가 음수 값을 허용하지 않습니까?
옳은. 상한도 없습니다.
교과서의 한 부분에서 정규 분포가 시험 점수를 모델링하는 데 좋을 수 있다고 말합니다.
그럼에도 불구하고, 이전의 진술에도 불구하고 때때로 그런 경우가 있습니다. 테스트 할 구성 요소가 많거나 너무 강하지 않은 경우 (예 : 본질적으로 수십 번 동일한 질문이 아니거나 각 부분이 이전 부분에 대한 정답을 요구하지 않음) 매우 쉽고 어렵지 않은 경우 ( 따라서 대부분의 마크는 중간 부근에 위치합니다. 그런 다음 마크는 보통 정규 분포에 의해 합리적으로 잘 추정 될 수 있습니다. 일반적인 분석이 거의 문제를 일으키지 않을 정도로 충분합니다.
우리는 그것이 정상적이지 않다는 것을 확실히 알고 있지만, 우리가 사용하는 절차의 행동이 우리의 목적에 맞아야하는 정도 (예 : 표준 오차, 신뢰 구간, 유의 수준)에 가깝다면 자동적으로 문제 가되지는 않습니다. 그리고 힘-필요한 것-우리가 기대하는 것에 가까이하십시오)
다음 부분에서는 자동차 보험 청구를 모델링하는 데 어떤 분포가 적합한 지 묻습니다. 이번에는 적절한 분포가 양수 값으로 만 연속적이므로 감마 또는 역 가우스가 될 것이라고 말했다.
그렇습니다. 그러나 그 이상은 크게 왜곡되는 경향이 있으며 평균이 커지면 변동성이 증가하는 경향이 있습니다.
차량 클레임에 대한 클레임 크기 분포의 예는 다음과 같습니다.
https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg
(Garrido, Genest & Schulz (2016)의 그림 5 : "보험 청구의 종속 주파수 및 심각도에 대한 일반화 된 선형 모델", 보험 : 수학 및 경제, Vol 70, 9 월, p205-215. https : //www.sciencedirect. com / science / article / pii / S0167668715303358 )
이것은 전형적인 오른쪽으로 치우침과 두꺼운 오른쪽 꼬리를 보여줍니다. 그러나 이것은 한계 분포이기 때문에 매우 조심해야하며 조건부 분포에 대한 모델을 작성하고 있습니다 . 이는 일반적으로 훨씬 덜 치우칩니다 (임계 값을 혼합하여 클레임 크기의 히스토그램을 수행하는 경우 살펴 보는 한계 분포). 이러한 조건부 분포 중). 그럼에도 불구하고 예측 변수의 하위 그룹 (아마도 연속 변수 분류)에서 클레임 크기를 보면 분포가 여전히 매우 오른쪽으로 치우치고 오른쪽에 상당히 짙은 꼬리표가 감마 모델과 같은 것을 제안하는 경우입니다. 가우스 모델보다 훨씬 더 적합합니다.
가우시안보다 더 적합한 다른 분포가있을 수 있습니다. 역 가우시안은 또 다른 선택입니다. 로그 정규 또는 Weibull 모델은 GLM이 아닌 상태에서도 유용 할 수 있습니다.
[이러한 분포가 거의 완벽한 묘사 인 경우는 드물다. 그것들은 부정확 한 근사치이지만, 분석이 유용하고 원하는 특성에 가까울 정도로 많은 경우에 충분합니다.]
시험 점수도 긍정적 인 값으로 만 지속될 것이라고 생각합니다. 왜 정규 분포를 사용합니까?
(앞서 언급 한 조건-너무 의존적이지 않고 어렵거나 쉽지 않은 많은 구성 요소)에서 분포는 대칭, 단봉 형 및 두꺼운 꼬리에 상당히 가깝습니다.