누군가는 왜도는 0이지만 대칭이 아닌 단봉 분포의 예를 제공 할 수 있습니까?


31

2010 년 5 월 위키 백과 사용자 인 Mcorazao 는 "이 값이 0이면 값이 평균의 양쪽에 비교적 고르게 분포되어 있지만 반드시 대칭 분포를 암시하지는 않는다" 는 문장을 왜곡 기사에 추가했습니다 . 그러나 위키 페이지에는이 규칙을 위반하는 실제 배포 예제가 없습니다. 인터넷 검색 "비대칭 분포가 0 인 비대칭 분포의 예"는 적어도 처음 20 개 결과에서 실제 예를 제공하지 않습니다.

기울기 계산은 및 R 공식E[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

왜도를 낮추기 위해 작은 임의 분포를 구성 할 수 있습니다. 예를 들어 분포

x = c(1, 3.122, 5, 4, 1.1) 

의 스큐를 생성합니다 . 그러나 이것은 작은 표본이며 대칭과의 편차가 크지 않습니다. 그렇다면, 비대칭 성이 높지만 여전히 0의 왜도를 갖는 하나의 피크로 더 큰 분포를 구성 할 수 있습니까?5.64947105


3
분포가 단조롭지 않겠습니까? 제목은 그렇게 말하지만 텍스트는이 점을 거의 언급하지 않습니다.
Dilip Sarwate

@Dilip 그렇습니다. 왜냐하면 중심 모멘트로서 왜도가 실제로 다른 의미가 없기 때문에 분포가 단조로운 경우 더 흥미 롭습니다.
앤디 맥켄지

답변:


28

불연속 분포를 고려하십시오. 지원 하나 값 음이 아닌 확률에 의해 결정된다 (a)가 (1) 및 (b)에 비대칭 계수 같음 합산하는 조건에 따라 0 (세번째 중심 모멘트가 0 임). 그것은 자유도를 남깁니다 (방정식이 아니라 방정식 해결 의미로!). 우리는 단조로운 솔루션을 찾을 수 있기를 바랍니다.x 1 , x 2 , , x k p 1 , p 2 , , p k k - 2케이엑스1,엑스2,,엑스케이1,2,,케이케이2

예제를 더 쉽게 검색하기 위해 고유 모드가 인 작은 대칭 벡터 에서 지원되는 솔루션을 찾았습니다. , 제로 왜곡. 그러한 해결책 중 하나는 입니다.0 ( P 1 , ... , P 7 ) = ( 1,396 , 3,286 , 9,586 , 47,386 , 8,781 , 3,930 , 1,235 ) / 75,600엑스=(,2,1,0,1,2,)0(1,,7)=(1396,3286,9586,47386,8781,3930,1235)/75600

확률 함수

비대칭임을 알 수 있습니다.

다음은 (비대칭)이고 명백한 비대칭 솔루션입니다 .p = ( 1 , 18 , 72 , 13 , 4 ) / 108엑스=(,1,0,1,2)=(1,18,72,13,4)/108

확률 함수 2

지금은 무슨 일인지 분명 : 평균 등호 때문에 , 음의 값은 기여 과 세 번째 순간에 양의 값 기여하면서 및 이므로 마이너스 기여도의 균형을 맞 춥니 다. 과 함께 과 같은 에 대한 대칭 분포를 에서 약간의 질량을 이동할 수 있습니다 행 에서 작은 질량 까지 다운 , 대량 소량 아래로( 3 ) 3 = 27 18 × ( 1 ) 3 = 18 4 × 2 3 = 32 13 × 1 3 = 13 0 x = ( 1 , 0 , 1 ) p = ( 1 , 4 , 1 ) / 6 + 1 + 2 + 1 10()=2718×(1)=184×2=3213×1=130엑스=(1,0,1)=(1,4,1)/6+1+2+110 0비대칭을 만드는 동안 평균은 으로, 왜도는 으로 유지합니다 . 동일한 접근 방식은 연속 분포의 평균이 0이고 왜도가 비대칭으로 유지되도록 작동합니다. 우리가 대중 이동에 너무 공격적이지 않으면 단조로운 상태로 남아있을 것입니다.00


편집 : 연속 분포

문제가 계속 발생하므로 지속적인 분포를 사용하여 명확한 예를 들어 보겠습니다. Peter Flom은 좋은 생각을 가지고있었습니다 : 법선의 혼합을보십시오. 두 법선의 혼합은 수행하지 않습니다. 왜도가 사라지면 대칭입니다. 다음으로 가장 간단한 경우는 3 개의 법선이 혼합 된 것입니다.

적절한 위치와 스케일을 선택한 후 3 개의 법선의 혼합은 6 개의 실제 매개 변수 에 의존 하므로 비대칭의 제로 왜도 솔루션을 생성하기에 충분한 유연성을 가져야합니다. 일부를 찾으려면 법선 혼합의 왜도를 계산하는 방법을 알아야합니다. 이 중 단봉이 아닌 것을 검색합니다 (아무 것도 없을 수 있음).

이제, 표준 정규 분포 의 (비 중앙) 모멘트는 이 홀수 일 때 0 이고 그렇지 않으면 . 표준 편차가 인 표준 정규 분포를 재조정 할 때 모멘트에 곱합니다 . 분포를 만큼 새로운 순간은 까지의 모멘트로 표현 될 수 있습니다. r 2 r / 2 Γ ( 1 - r아르 자형아르 자형 σrthσrμrthr2아르 자형/2Γ(1아르 자형2)/πσ아르 자형σ아르 자형μ아르 자형아르 자형. 분포 혼합의 모멘트 (즉, 가중 평균)는 개별 모멘트의 동일한 가중 평균입니다. 마지막으로, 세 번째 중심 모멘트가 0 일 때 왜도는 제로이며, 이것은 처음 세 모멘트로 쉽게 계산됩니다.

이것은 우리에게 문제에 대한 대수적 공격을 제공합니다. 내가 찾은 한 가지 해결책은 매개 변수 가 , 및 인 세 법선의 균등 한 혼합입니다. . 평균은 입니다. 이 이미지는 pdf를 파란색으로, 분포의 pdf를 평균 으로 빨강으로 뒤집 었습니다 . 그것들이 다르다는 것은 둘 다 비대칭임을 보여줍니다. (이 모드는 약 의 평균과 다른 약 입니다.) 둘 다 구성에 의해 왜도가 없습니다 .( 0 , 1 ) ( 1 / 2 , 1 ) ( 0 , (μ,σ)(0,1)(1/2,1)(0+1/2+0)/3=1/60.05192161/6(0,127/18)(0,2.65623)(0+1/2+0)/=1/60.05192161/6

연속적인 예

플롯은 이것이 단봉 형임을 나타냅니다. (미적분을 사용하여 미적분을 사용하여 확인할 수 있습니다.)


(+1) 매우 매끄러운 답변입니다. 그래도 연속 배포에서도 작동합니까? 변화가 잠재적으로 작은 모드를 만들지 않습니까? 나는 똑바로 생각하지 않을 수 있습니다 ...
Macro

1
당신은 꽤 잘 생각하고 있습니다. Macro : 우리는 모두 매우 회의적이어야합니다. 비결은 넓은 범위에 걸쳐 소량을 분산시키는 것입니다. 첫 번째 파생 테스트가 가능한 모드를 확인 할 수있게도하는 증거의 기초가 제공됩니다 충분히 이 양식의 작은 변화가됩니다 하지를 새로운 모드를 생산합니다.
whuber

답변 해주셔서 감사합니다! 이것은 내가 직관적으로 생각한 것과 비슷하지만, 단어를 잘 표현할 수는 없었습니다. 분포의 각 측면에서 질량을 "균형화"해야한다는 것입니다. 이 밸런싱 동작을 수행 할 수있는 고정 관념이 있는지 궁금합니다.
Andy McKenzie

한 가지 방법 인 Andy는 개별 솔루션으로 시작한 다음 정규 분포로이를 통합하는 것입니다. 이 경우, 단일성 요구 사항은 정규 분포가 표준 편차가 크도록 강제합니다. 그럼에도 불구하고 컨볼 루션이 필수 특성 (예 : 왜곡도 없음)을 변경하지 않거나 예측 가능한 방식으로 변경하는 경우 문제를 수학적으로 처리 할 수 ​​있습니다. 어떤 의미에서 최근 편집 내용은 이러한 공격으로 볼 수 있지만 세 개의 법선이 다른 표준 편차를 갖기 때문에 엄밀히는 회선이 아닙니다.
whuber

2
앤디를 확인했습니다. 이산 솔루션을 정규 분포로 변환해도 왜도가 변하지 않습니다. 정규 분포에 0.57 이상의 표준 편차를 주면 결과는 단조롭습니다. 기본 이산 분포와 마찬가지로 평균이 0이고, 왜도가없고, 비대칭입니다. 이것을 표준 정규 분포와 혼합하면 표준 정규 분포와 이산 분포 사이의 질량 이동이 제어됩니다. "스테레오 타이핑 된"방법에 대한 요청을 충족시킬 수 있습니다.
whuber

23

다음은 내가 https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# 에서 찾은 것입니다 . 또는 모양 매개 변수 및 Dagum 분포 :c = 18.1484케이=0.0629c=18.1484

(엑스)=기음케이엑스(기음+1)[1+엑스기음](케이+1)

평균 0.5387, 표준 편차 0.2907, 왜도 0.0000 및 첨도 2.0000입니다. 소스는 또한 이것을 "코끼리 분포"라고 부릅니다. 여기에 이미지 설명을 입력하십시오

R에서의 나의 생식은

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

이 출력에서 ​​볼 수 있듯이 이러한 매개 변수 값의 왜곡은 0에서 4 자리가 아닙니다. 다음은 와 대한 작은 최적화 프로그램입니다 .c케이기음

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

굽힐 수 있는

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

편집 해 주셔서 감사합니다. 즉, 0.0000 ~ 4 자리의 왜도를 재현 할 수 없으므로 대신 0.0001245138을 얻습니다 (R 코드에서 다음 편집 참조).
Christoph Hanck

왜도가 0에 가깝도록 및 값 을 찾기 위해 간단한 옵티 마이저를 실행할 수 있습니다. 몇 개의 추가 라인 또는 하나의 라인이어야합니다. 이미 마지막 줄에서 손실 함수를 분석적으로 계산했습니다. R에 적합한 일반 옵티마이 저가 있습니까? k기음케이
amoeba는 11시 17 분에 Reinstate Monica

실제로 0.0003756196입니다. 0.0001245138은 실수로 여기에 주어진 초기 최적화 후에 이미 있습니다. 나는 볼 것이다.
Christoph Hanck 2016 년

@amoeba, 나는 약간의 최적화를 시도했지만 영리한 방식으로 그 일을했다고 주장하지는 않지만 최적화에 대한 경험이 거의 없습니다.
Christoph Hanck

2
0에서 3 자리 (거의 4) 정도의 왜곡은 제 마음에 충분했습니다. 좀 더 정확한 가치가 아닌 것처럼 보일 것입니다. 그 근방에서 왜도가 0을 넘어서고 더 많은 정확도가 필요한 경우 값을 조정할 방향이 분명하다면 충분하다고 생각합니다. 그러나 추가 노력을 기울이십시오. (그런데 멋진 예입니다.)
Glen_b-복지국 Monica

9

실수 선의 양의 절반에 대한 분포를 고려하여 0에서 모드로 선형으로 증가한 다음 모드의 오른쪽에 지수 적이지만 모드에서는 연속적입니다.

이것을 삼각 지수 분포라고 할 수 있습니다 (상어 지느러미와 약간 비슷하지만).

하자 모드의 위치 및 수 지수의 레이트 파라미터 일.λθλ

마찬가지로 증가 분포가 점진적으로 적게 경사진다. 마찬가지로 과거 증가 플러스로부터 마이너스로 제 모멘트 십자가 :λ θ 6.15λθλθ6.15

왜곡이없는 삼각 지수

Brizzi (2006) 는이 분포 군을 "양면"분포라고하며, 세 번째 모멘트 왜곡이 0 인이 교차점에 대해 설명합니다. 폰 Hippel (2005) 그 교차 지점에서 거의의 예를 제시 여기를[ 2 ][1][2]

스큐 및 제로 초과 첨도를 갖는 스레드 비정규 분포? 작은 불연속 예제와 다른 연속적인 예제를 포함하여 비대칭 예제가 있습니다.

제로 왜도를 갖는 단일 모드 가우스 혼합

왜도가없는 이산 단봉 분포 (또는 동등하게 샘플)는 크거나 작은 크기로 구성하기가 매우 쉽습니다.

다음은 샘플로 처리하거나 (원시 주파수를 3000으로 나눔) pmf ( 'x'값은 취한 값, 'n'은 샘플에서 값이 발생하는 횟수입니다)로 처리 할 수있는 예입니다. ) :

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

위에서 구성된 확률 질량 함수의 도표

이 예제는 3 점 분포로 구성됩니다.

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

다양한 값에 걸쳐 (3) 및 (10) 사이의이 (의해 파라미터 "원자"3- 포인트)를 갖는다 및 선회 수단의 다양한 선택에 걸쳐 혼합물 것을, 제로가 왜도. 비대칭 성 및 세 번째 중심 모멘트가 0 인 3 개의 점에 대한 분포보다 작은 것을 만들 수는 없습니다. 이러한 점과 같이 몇 점에 걸친 간단한 조각 모음은 더 큰 구조물을 만들 수있는 깔끔한 빌딩 블록을 만듭니다.c i n i x i = 0 i n i x 3 i = 0 c기음기음나는나는엑스나는=0나는나는엑스나는=0기음

이러한 "원자"는 구성 할 수있는 모든 방식이 있지만이 예에서는이 유형 만 사용합니다. 이와 같은 원자의 일부 조합에는 나머지 구멍을 채우고 평균 및 세 번째 모멘트의 구조를 파괴하지 않고 단일성을 보장하기 위해 대칭으로 배치 된 몇 가지 값이 추가됩니다.

[1] Brizzi, M. (2006),
"삼각형과 지수 특징을 결합한 비대칭 모형 : 양측 분포와 통계적 속성"
Austrian Journal of Journal , 35 : 4, p455–462
http : //www.stat .tugraz.at / AJS / ausg064 /

[2] von Hippel, PT (2005),
"평균, 중앙값 및 기울이기 : 교과서 규칙 수정"
통계 교육 저널 13 권 2 호
http://ww2.amstat.org/publications/jse/v13n2/ vonhippel.html


3
아마도 그것을 "상어 지느러미"라고 부를 수 있을까요?
Glen_b-복지 주 모니카

@Glen_b 완전히 상어 지느러미.
Alecos Papadopoulos 2016 년

2

확실한. 이 시도:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(당신은 이미 어려운 일을했습니다!)


1
좋아, 내가 좋아하는거야. +1
gung-Reinstate Monica

4
그것은 바이 모달이 아닙니다 ... 그것은 엄청나게 멀티 모달입니다. 밀도를 플로팅하십시오. curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
손님

1
이런 식으로 생성 된 데이터는 확실히 단조롭지 않습니다. 이를 확인하기 위해 코드를 잘라서 붙여 넣기 만하면됩니다. 실제로 정규 분포 변수의 혼합은 절대적 일 수 없습니다 (물론 혼합 비율 중 하나가 1이 아닌 한).
Macro

8
@ 매크로, 맞지 않습니다. 예를 들어 "평균이 최소 2 개의 표준 편차로 분리되지 않는 한 두 혼합 법선의 밀도가 이봉이 아님"이라는 잘 알려진 결과에 대해서는 Roeder 1994 (JASA) 개요를 참조하십시오. 이들이 이보다 적게 분리되면 혼합물은 단봉이다.
손님

1
당신은 바로 @guest입니다. 게시물을 만들 때의 가능성에 대해 잊어 버렸습니다
Macro

2

이자형[(엑스μσ)]=0
이자형[(엑스μσ)|엑스μ]+이자형[(엑스μσ)|엑스>μ]=0.

와이μ

이자형[(와이μσ)]=이자형[(μσ)]
엑스와이μ(μ)

와이μμ


1
분포가 단조롭다는 것을 어떻게 보장합니까?
Dilip Sarwate

와이μ

σ와이

@ whuber : 젠장. 나는 거기 알고 있었다 몇 가지 함정 ... :-)로
krlmlr

2

다음의 이산 분포는 비대칭이며 널 왜곡이 있습니다 : Prob (-4) = 1 / 3, Prob (1) = 1 / 2, Prob (5) = 1 / 6. Doric et al., Qual Quant (2009) 43 : 481-493; DOI 10.1007 / s11135-007-9128-9


+1 체크 아웃하고 단조로운 상태입니다. 이것이 가장 간단한 예입니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.