통계에서 함수의 중요성은 무엇입니까 ?


19

미적분학 클래스에서 함수 또는 "bell curve"가 발생하여 통계에 자주 적용된다고 들었습니다.ex2

호기심에서 나는 묻고 싶다 : 함수 가 통계에서 정말로 중요한가? 그렇다면 의 장점은 무엇이며 어떤 응용 프로그램이 있습니까?ex2ex2

인터넷에서 기능에 대한 많은 정보를 찾을 수는 없었지만 조사를 한 결과 일반적인 종 곡선과 정규 분포 라는 링크가 발견되었습니다 . 위키 백과 페이지 날에 의해 강조 상태에두고, 통계 응용 프로그램 기능 이러한 유형의 링크 :

"정규 분포는 통계에서 가장 눈에 띄는 확률 분포로 간주됩니다. 몇 가지 이유가 있습니다. 1 첫째, 정규 분포는 중앙 한계 정리에서 발생합니다. 온화한 조건에서 많은 랜덤 변수의 합이 도출됩니다. 동일한 분포에서 원래 분포의 형태에 관계없이 대략 정상적으로 분포 됩니다. "

따라서 어떤 종류의 설문 조사 등에서 많은 양의 데이터를 수집하면 ? 이 함수는 대칭이므로 대칭, 즉 정규 분포에 대한 유용성, 통계에 유용한 이유는 무엇입니까? 나는 단지 추측하고 있습니다.ex2

일반적으로 가 통계에서 유용한 이유는 무엇 입니까? 정규 분포가 유일한 영역 인 경우 정규 분포의 다른 가우스 유형 함수 중에서 독특하거나 특히 유용한 이유는 무엇 입니까?ex2ex2


시작하려면 "sum"이 아니라 "mean"을 읽어야합니다.
Tristan

2
합계도. 결국, 그것은 샘플의 수를 곱한 평균입니다.
Erik

1
인용문은 검색의 키워드에 "정규 분포"가 포함되어 있음을 보여줍니다. 여기 에서 검색을 수행 하면 이 사이트가 시작된 후 하루 평균 1,600 개가 넘는 스레드가 발견됩니다. 이러한 조회수를 잠시 숙독하면 통계에서 "종 곡선"의 역할을 누구나 쉽게 이해할 수 있습니다.
whuber

4
정규 분포와 관련 하여 가장 많이 투표 된 스레드에서 : "모든 사람은 지수의 오차 법칙 (즉, 정규 분포)을 믿습니다. 실험자들은 그것이 수학에 의해 증명 될 수 있다고 생각하기 때문에 수학자와 그것이 "관찰에 의해 설립되었습니다."
whuber

"가우스 분포의 가장 놀라운 특성이 무엇인지"내 질문에 대한 답변을 참조 stats.stackexchange.com/questions/4364/...
로빈 지라

답변:


12

이 기능이 중요한 이유는 실제로 정규 분포와 밀접하게 연결된 동반자, 중심 한계 정리입니다 ( 여기 다른 질문 에서 CLT에 대한 좋은 설명이 있습니다).

통계에서, CLT는 일반적으로 대략적으로 영아를 계산하는 데 사용될 수 있으며, "우리는 95 % 확신합니다 ..."와 같은 진술을 할 수 있습니다 ( "95 % 확신"의 의미는 종종 오해되지만 다른 문제입니다).

함수 (의 스케일 된 버전)의 정규 분포의 밀도 함수이다. 정규 분포를 사용하여 랜덤 수량을 모델링 할 수있는 경우이 함수는 해당 수량의 가능한 값이 얼마나 다른지 설명합니다. 밀도가 높은 지역의 결과는 밀도가 낮은 지역의 결과보다 더 높습니다.exp((xμ)22σ2)

σ μ μ σ x = μ x μ σμ 및 는 밀도 함수의 위치 및 스케일을 결정하는 매개 변수입니다. 에 대해 대칭 이므로 를 변경하면 함수를 오른쪽이나 왼쪽으로 옮깁니다. 는 밀도 함수의 값을 최대 값 ( )으로 결정하고 가 에서 멀어 질 때 얼마나 빨리 0이되는지 결정합니다 . 그런 의미에서 변경하면 함수의 스케일이 변경됩니다.σμμσx=μxμσ

특정 선택 인 및 경우 밀도는 ( 비례 함) 입니다. 이것은 이러한 매개 변수 중에서 특히 흥미로운 선택은 아니지만 다른 모든 것보다 약간 더 단순하게 보이는 밀도 함수를 생성하는 이점이 있습니다.σ = 1 / μ=0 전자 - X 2σ=1/2ex2

반면에, 변수 변화 의해 에서 다른 정규 밀도로 이동할 수 있습니다 . 교과서에 가 아니라 라고 말하는 이유 는 중요한 기능은 를 작성하는 것이 더 간단 하다는 것입니다 . x = u μex2E-X2EXP(-(X-μ)2엑스=μ2σ이자형엑스2ex2특급((엑스μ)22σ2)이자형엑스2


1
끝에서 두 번째 단락의 (1) 첫 번째 문장 : 내가 말할 수있는가 에 비례 대신 입니다 .
추기경

@ cardinal : 고마워, 당신 말이 맞아! 나는 대답을 편집했다.
MånsT

1
+1,이 답변이 정말 마음에 듭니다. 지적 할 가치가있는 한 가지는 보통의 pdf가 보통 로 작성된다는 것입니다 . 그 이유는 곡선 아래의 총 면적이 와 같지만 pdf의 일반적인 용도는 확률 (1의 합)을 결정하는 것이므로 면적에 편리합니다. 곡선 아래에서 1과 같으므로, 우리는 그 결과를 달성하기 위해 합계로 나눕니다. 나는 이것이 단순한 외관을 위해 생략되었다는 것이 옳다고 생각합니다. 12πσ22πσ2
gung-Monica Monica 복원

3

자네 말이 맞아, 정규 분포 또는 가우스는 축소 및 이동입니다 의 중요성 때문에, 가 기본적으로 정규 분포라는 사실에서 주로 온다.exp ( x 2 )특급(엑스2)특급(엑스2)

정규 분포는 주로 "많은"이 무한대에 접근 할 때 ( "가벼운 규칙 성 조건 하에서") 많은 독립적이고 동일하게 분포 된 랜덤 변수의 합이 정규에 접근하기 때문에 중요합니다.

모든 것이 정상적으로 배포되는 것은 아닙니다. 예를 들어, 응답이 연속적인 규모가 아니라 정수 1-5와 같은 경우 설문 조사 결과가 아닐 수 있습니다. 그러나 평균 평균 단지 스케일링 (정규화) 합이며, 각각의 응답은 서로 독립적이기 때문에 결과는 일반적으로 위에 샘플링 반복 분포한다. 물론 샘플이 충분히 크다고 가정하면 엄격하게 말하면 샘플의 크기가 무한해질 때만 정규성이 나타납니다.

예제에서 알 수 있듯이 정규 분포는 데이터가 정규 분포가 아닌 경우에도 추정 또는 모델링 프로세스의 결과로 나타날 수 있습니다. 따라서 정규 분포는 통계의 모든 곳에 있습니다. 베이지안 통계에서, 매개 변수의 많은 사후 분포는 대략 정상이거나 추정 될 수 있습니다.


Re : "정규 분포 또는 가우스는 확장되고 이동 된 exp (-x ^ 2)이므로 exp (-x ^ 2)의 중요성은 주로 정규 분포라는 사실에서 비롯됩니다." 정규 분포 의 확률 밀도 는 구 아시안 함수입니다. 정규 분포 자체는 와 동의어가 아닙니다 . 이자형엑스2
Macro

그것들을 지적 해 주셔서 감사합니다. (내 의도는 정확하지 않고 통계학자가 이해할 수없는 것이 었습니다. 이미 정확한 정확한 답변이 있습니다.)
scellus

-1

CLT의 한 버전은 독립적으로 동일하게 분포 된 랜덤 변수의 평균 분포 가 합 ( ) 의 변수 수가 클수록 모양의 정규 분포 처럼 보이기 시작할 것이라고 말합니다 . 공식적인 수학적 수렴은 평균이 적절하게 정규화 될 때 분포의 온화한 조건에서 발생합니다. 이것은 감마 , 삼각 , 균일 , 베타 , 카이 제곱 , 심지어 Bernoulli 와 같은 불연속 분포를 포함한 다양한 형태의 대부분의 인구 분포에 적용됩니다.0 1 / N . 따라서 가설을 검정 하거나 근사 정규 분포를 기반으로 신뢰 구간을 구성 하여 랜덤 표본 기반 분포의 평균을 쉽게 추론 할 수 있습니다. 표본 평균의 분산이 의 비율 로 이되기 때문에, 평균은 실제로 모집단 평균에서 모든 확률 질량을 갖는 축퇴 분포로 수렴합니다. 따라서 정규화에 대한 수렴을위한 적절한 정규화에는 의한 최근 화 및 곱셈이 필요합니다 . 정상으로 수렴되는 다른 통계도 있습니다. 정규 분포를 사용하여 다양한 검정 통계량 의 분포를 근사화 할 수 있다는 사실01/nn 통계에서 두드러진 이유입니다.


chat.stackexchange.com/rooms/3720/… 에서이 질문에 대한 코멘트를위한 대화방이 작성되었습니다 . 나는 모든 (50!) 주석을 삭제하고 주석 메커니즘의 남용을 방지하기 위해이 게시물을 잠갔습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.