분포의 평균에 대한 순간 직감?


14

누군가가 세 번째와 네 번째 모멘트와 같이 확률 분포 의 더 높은 모멘트 가 왜도 및 첨도에 해당 하는지에 대한 직감을 제공 할 수 있습니까 ? 구체적으로, 왜 세 번째 또는 네 번째 거듭 제곱으로 올린 평균에 대한 편차가 왜도 및 첨도의 척도로 변환 되는가? 이것을 함수의 3 차 또는 4 차 미분과 관련시키는 방법이 있습니까?pX

왜도 및 첨도에 대한 다음 정의를 고려하십시오.

Skewness(X)=E[(XμX)3]/σ3,Kurtosis(X)=E[(XμX)4]/σ4.

이 방정식에서 정규화 된 값 를 거듭 제곱하고 기대 값을 취합니다. 정규화 된 랜덤 변수를 4의 거듭 제곱으로 올리는 이유가 왜 "피크 니스"를 제공하는지, 왜 정규화 된 랜덤 변수를 3의 거듭 제곱으로 올리는 것이 왜 "왜곡"을 제공해야하는지 명확하지 않습니다. 이것은 마법적이고 신비한 것 같습니다!(Xμ)/σ


4
왜곡에 대한 나의 직감은 세 번째 힘이 부정적인 것을 보존한다는 점에 주목하는 것입니다. 따라서 양보다 평균에서 음의 편차가 더 크면 (매우 간단히 말하면) 음의 비대칭 분포로 끝납니다. 첨도에 대한 나의 직감은 네 번째 힘이 두 번째 힘보다 훨씬 큰 평균에서 큰 편차를 증폭한다는 것입니다. 이것이 우리가 첨도를 분포의 꼬리가 얼마나 뚱뚱한가의 척도로 생각하는 이유입니다. 평균 mu로부터 x의 매우 큰 가능성이 4 차 거듭 제곱으로 높아져 증폭되지만 부호는 무시합니다.
wolfsatthedoor 2


1
제 4의 힘은 제 1의 힘보다 특이 치에 의해 훨씬 더 많은 영향을 받기 때문에, 적어도 견고성이 목표라면 중앙값에 대한 네 번째 순간을 보는 것에서 거의 얻을 수 없을 것으로 기대합니다.
Glen_b-복지 모니카

1
먼저, 이러한 높은 모멘트가 반드시 비대칭 / 피크 ​​니스의 좋은 / 신뢰할 수있는 척도는 아닙니다. 즉, 평균 = 빔 밸런스 / 스케일 , 분산 = 캔틸레버 굴곡 , 왜도 = 시소 와 같이 이 처음 세 순간에 대해 좋은 물리적 직감을 제공한다고 생각 합니다.
GeoMatt22

1
"말소리"를 측정하는 것으로 첨도의 해석 마술적이고 신비합니다. 그것은 사실이 아니기 때문입니다. Kurtosis는 피크에 대해 전혀 아무것도 말하지 않습니다. 꼬리 (이상치) 만 측정합니다. 피크 근처의 관측치가 피크가 평평한 지, 스파이크 형인지, 바이 모달 형, 사인 파형인지 또는 종 모양인지에 관계없이 첨도 측정에 약간의 양을 기여한다는 것을 수학적으로 쉽게 증명할 수 있습니다.
피터 웨스트 폴

답변:


8

이러한 정의에 대한 정당한 이유가 있습니다. 표준화 된 랜덤 변수의 순간에 대한 일반적인 형식을 볼 때 더 명확 해집니다. 이 질문에 대답하기 위해, 우선 n 번째 표준화 된 중심 모멘트 의 일반적인 형태를 고려하십시오 :

ϕn=E[(XE[X]S[X])n ].

처음 두 개의 표준화 된 중심 모멘트는 ϕ1=0ϕ2=1 , 위의 수량이 잘 정의 된 모든 분포에 대해 유지됩니다. 따라서 우리는 값 n3 대해 발생하는 사소한 표준화 된 중심 모멘트를 고려할 수 있습니다 . 분석을 용이하게하기 위해 다음을 정의합니다.

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

이는 음수가 아닌 양 으로, 표준화 된 랜덤 변수 의 n 번째 절대 전력이 기대 값보다 높거나 낮은 경우 조건부로 제공됩니다. 이제 표준화 된 중심 모멘트를이 부분으로 분해합니다.


n 홀수 값은 꼬리의 스큐를 측정합니다. n3 의 홀수 값 에 대해 모멘트 방정식에 홀수 전력이 있으므로 표준화 된 중앙 모멘트를 ϕn=ϕn+ϕn 으로 쓸 수 있습니다 . 이 양식에서 우리는 표준화 된 중심 모멘트가 각각의 평균보다 높거나 낮은 조건에 따라 표준화 된 랜덤 변수 의 n 번째 절대 검정력 간의 차이를 제공 한다는 것을 알 수 있습니다.

따라서 모든 홀수 거듭 제곱 n3 에 대해 표준화 된 랜덤 변수의 예상 절대 검정력이 평균보다 높은 값보다 평균보다 높은 값에 대해 더 높은 경우 양수 값을 제공하고 예상 된 절대 값에 대해 음수 값을 제공하는 측정 값을 얻습니다 평균보다 낮은 값보다 평균보다 높은 값의 경우 검정력이 낮습니다. 이들 양은 합리적으로 "비대칭"유형의 척도로 간주 될 수 있으며, 더 높은 출력은 평균에서 멀리 떨어져있는 값에 비해 상대적 가중치가 더 큽니다.

이러한 현상은 모든 홀수 전력 발생 이후 n3 "비대칭"의 전형적인 측정 값의 자연 선택 정의하는 ϕ3 비대칭도있다. 이것은 높은 홀수보다 표준화 된 중앙 모멘트이며, 높은 모멘트를 고려하기 전에 낮은 모멘트를 탐색하는 것이 당연합니다. 통계에서 우리는 분포의 이러한 측면을 측정하는 가장 낮은 표준화 된 중심 모멘트 이므로이 표준화 된 중심 모멘트를 왜도 라고하는 규칙을 채택 했습니다. (높은 홀수 거듭 제곱은 왜도 유형을 측정하지만 평균에서 멀리 떨어진 값을 강조합니다.)


n 짝수 값은 꼬리의 치명도를 측정합니다. n3 의 짝수 값 에 대해 모멘트 방정식에 균일 한 검정력이 있으므로 표준화 된 중앙 모멘트를 ϕn=ϕn++ϕn 으로 쓸 수 있습니다 . 이 양식에서 우리는 표준화 된 중심 모멘트가 각각의 평균보다 높거나 낮은 조건에 따라 표준화 된 랜덤 변수 의 n 번째 절대 검정력의 합을 제공 한다는 것을 알 수 있습니다.

따라서, 심지어 어떤 힘에 대해 n3 우리는 표준화 된 확률 변수의 분포의 꼬리 오르게하는 경우 발생하는 이상 값이, 음이 아닌 값을 제공하는 계수를 얻을 것이다. 이는 표준화 된 랜덤 변수에 대한 결과 이므로 척도 변경 (분산 변경)은이 측정에 영향을 미치지 않습니다. 오히려 분포의 분산을 표준화 한 후 꼬리의 비만을 효과적으로 측정 한 것입니다. 이들 양은 합리적으로 일종의 "커트 시스"의 척도로 간주 될 수 있으며, 더 높은 거듭 제곱은 평균과는 거리가 큰 값에 비해 상대적 가중치가 커집니다.

이러한 현상은 모든 전원에도 발생하기 때문에 n3 , 원형의 측정 값의 자연 선택 첨도가 정의하는 ϕ4 첨도있다. 이것은 고른 힘보다 표준화 된 중심 모멘트가 낮으며, 고차 모멘트를 고려하기 전에 저차 모멘트를 탐색하는 것이 당연합니다. 통계에서 우리는 분포의 이러한 측면을 측정하는 가장 낮은 표준화 된 중심 모멘트이기 때문에이 표준화 된 중심 모멘트를 "쿠 르토 시스"로 지칭하는 규칙을 채택했습니다. (높은 짝수의 힘은 첨도의 유형을 측정하지만 평균에서 멀리 떨어진 값에 점점 더 중점을 둡니다.)


이 방정식은 처음 두 모멘트가 있고 분산이 0이 아닌 분포에 대해 잘 정의되어 있습니다. 우리는 관심있는 분포가 나머지 분석에서이 등급에 속한다고 가정 할 것입니다.


2

비슷한 질문 확률 분포의 '순간'에 대해 '순간'이란 무엇입니까? 나는 순간을 해결 한 것에 대한 물리적 인 대답 을했다.

"각가속도는 각속도의 미분으로 시간에 대한 각도의 미분입니다. 즉, dωdt=α,dθdt=ωθ

실제 예제를 통해이를 시각화하는 것이 더 쉬울 수 있으므로 링크 를 참조하십시오 .

왜도는 첨도보다 이해하기 쉽습니다. 음의 왜도는 오른쪽보다 무거운 왼쪽 꼬리 (또는 추가 음의 방향 이상치)이고 반대는 양의 왜도입니다.

x


Z3Z4Z3Z4

@PeterWestfall Moors의 해석이 불완전하다는 데 동의합니다. 정확한 언어는 혼동되지 않고는 쉽게 달성 할 수 없습니다. 예를 들어 "leverage"를 생각해보십시오. 레버리지는 첫 번째 순간을 의미하며 두 번째 순간에는 "leveraged lever"와 같은 것을 발명해야합니다. 귀하의 접근 방식은 논란의 여지가 있고 다른 사람에게는 비 물리적 인 위험에 대해 자기 일관성을 선호하는 일부 지지자들을 주장 할 수있는 기하학적 변형을 암시 할 수있는 새로운 개념, 즉 "확장 레버리지"를 발명 한 것으로 보입니다. .
Carl

UU=Z4

Z4Z

Z2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.