고원 모양의 분포가 있습니까?


답변:


53

일반 정규 (버전 1) , 서브 보틴 분포 또는 지수 전력 분포 의 이름으로 알려진 분포를 찾고있을 수 있습니다 . pdf 로 위치 , 스케일 및 모양 로 매개 변수화됩니다.μσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

알다시피, 경우, Laplace 분포와 유사하고 수렴합니다. 는 정상으로 수렴하고 때 균일 한 분포입니다.β=1β=2β=

여기에 이미지 설명을 입력하십시오

구현 된 소프트웨어를 찾고 있다면 normalpR 라이브러리를 확인할 수 있습니다 (Mineo and Ruggieri, 2005). 이 패키지의 장점은 무엇보다도 표준을 최소화하는 된 정규 분포 오류로 회귀를 구현 것입니다.Lp


Mineo, AM, & Ruggieri, M. (2005). 지수 전력 분배를위한 소프트웨어 도구 : normalp 패키지. 통계 소프트웨어 저널, 12 (4), 1-24.


20

@StrongBad의 의견은 정말 좋은 제안입니다. 균일 한 RV와 가우스 RV의 합은 매개 변수를 올바르게 선택하면 원하는 것을 정확하게 얻을 수 있습니다. 그리고 실제로는 폐쇄 형 솔루션 이 상당히 좋습니다.

이 변수의 pdf는 다음 표현식으로 제공됩니다.

14a[erf(x+aσ2)erf(xaσ2)]

a 는 제로 평균 균일 한 RV의 "반경"이다. 는 제로 평균 가우스 RV의 표준 편차입니다.σ

PDF


3
참조 : Bhattacharjee, GP, Pandit, SNN 및 Mohan, R. 1963. 직사각형 및 정규 오차 분포가 포함 된 치수 체인. 기술 통계, 5, 404–406.
Tim

15

무한한 "평판 모양"분포가 있습니다.

"가우시안과 유니폼 사이"보다 더 구체적인 것이 있었습니까? 다소 모호합니다.

다음은 쉬운 방법 중 하나입니다. 유니폼의 각 끝에서 항상 절반의 노멀을 붙일 수 있습니다.

균일 한 중심 및 가우스 꼬리를 갖는 밀도

법선의 스케일을 기준으로 유니폼의 "폭"을 제어 할 수 있으므로 고원을 넓거나 좁힐 수 있으며 가우스와 유니폼을 제한 사례로 포함하는 전체 분포 등급을 제공 할 수 있습니다.

밀도는 다음과 같습니다

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

여기서h=11+w/(2πσ)

마찬가지로 고정위한 , 우리가 균일 한 접근 등 및 고정 용 우리는 접근 .σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

다음은 몇 가지 예입니다 ( 각각 경우).μ=0

이 가우스 꼬리 제복의 다양한 예의 그림

아마도이 밀도를 "가우스 꼬리 제복"이라고 부를 수 있습니다.


1
아! 나는 가우시안 꼬리 제복을 입고 공식적인 공에 참석하는 것을 좋아합니다 ! ;)
Alexis

7

여기 [1]에서 "Devil 's tower"배포판을보십시오 :

f(x)=0.3334 들어, ; , ; 및 ,.|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

평평한 상단, 볼록한면을 가진 악마의 타워 밀도 기능

"슬립 드레스"배포는 훨씬 더 흥미 롭습니다.

원하는 모양의 분포를 쉽게 구성 할 수 있습니다.

[1] : Westfall, PH (2014)
"정점으로의 첨도, 1905 – 2014. RIP"
Am. 통계 68 (3) : 191–195. doi : 10.1080 / 00031305.2014.917055
공개 액세스 pdf : http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


피터 안녕하세요-저는 기능을 부여하고 이미지를 삽입 할뿐만 아니라 완전한 참조를 할 자유를 얻었습니다. (기억이 제공되면 Kendall과 Stuart가 고전 텍스트에서 유사한 디 벙킹에 대한 세부 정보를 제공한다고 생각합니다. 올바르게 기억한다면-오랜 시간이 걸렸습니다. 또한 꼬리가 무겁지 않다고 생각합니다)
Glen_b -Reinstate Monica

고마워요, Glen_b. 나는 첨도 수치가 측정하는 것을 첨도가 측정한다고 말한 적이 없다. 오히려, 나의 논문은 첨도가 매우 광범위한 분포의 경우 거의 E (Z ^ 4 * I (| Z |> 1))와 동일하다는 것을 증명합니다. 따라서 첨도는 일반적으로 {Z : | Z | 범위에서 발견되는 '피크'에 대해 아무 것도 알려주지 않습니다. <1}. 오히려 대부분 꼬리에 의해 결정됩니다. "무거운 꼬리"라는 용어에 다른 의미가 있으면 E (Z ^ 4 * I (| Z |> 1))라고합니다.
Peter Westfall

또한 @Glen_b 어떤 테일 인덱스를 언급하고 있습니까? 무한히 많다. 테일 크로싱은 "테일"을 올바르게 정의하지 않습니다. 꼬리 무거움의 일부 꼬리 교차 정의에 따르면 N (0,1)은 .9999 * U (-1,1) + .0001 * U (-1000,1000)보다 "무거운 꼬리"입니다. 유한 한 꼬리에도 불구하고 분명히 더 두꺼운 꼬리. 그리고 BTW는 후자가 N (0,1)과 달리 첨도가 매우 높다.
Peter Westfall

내 의견에 "꼬리 색인"이라고 말하는 것을 찾을 수 없습니다. "어떤 테일 인덱스를 참조하고 있는지"라고 말할 때 무엇을 참조하고 있는지 잘 모르겠습니다. 두꺼운 꼬리에 대해 조금이라도 의미한다면 Kendall과 Stuart가 실제로 말하는 것을 확인하는 것이 가장 좋습니다. 나는 그들이 대칭 표준화 변수에 대한 밀도의 점근 적 비율을 실제로 비교한다고 생각하지만, 아마도 생존자 기능 일 수도 있습니다. 요점은 내 것이 아니라 그들이었다
Glen_b-복지국 모니카

이상한. 어쨌든 켄달과 스튜어트는 틀렸다. Kurtosis는 나의 이론이 증명하는 것처럼 분명히 꼬리 무게의 척도입니다.
피터 웨스트 폴

5

좋은 답변이 많이 있습니다. 여기에 제시된 솔루션은 (i) 특히 간단한 기능적 형태를 가지고 있으며 (ii) 결과 분포가 반드시 특수한 형태가 아닌 고원 모양의 pdf를 생성한다는 두 가지 특징이 있습니다. 나는 이것이 이미 문헌에 이름이 있는지 확실하지 않지만, pdf 가진 고원 분포라고 부릅니다 .f(x)

f(x)=k11+x2afor xR

어디에:

  • 매개 변수 는 양의 정수이며a
  • k 는 상수의 상수입니다 : k=aπsin(π2a)

다음은 매개 변수 다른 값에 대한 pdf 플롯입니다 .a

여기에 이미지 설명을 입력하십시오

.

모수 가 커짐에 따라 밀도는 Uniform (-1,1) 분포를 향합니다. 다음 플롯은 표준 표준 (회색 점선)과 비교됩니다.a

여기에 이미지 설명을 입력하십시오


3

다른 하나 ( EDIT : 지금 단순화했습니다. EDIT2 : 훨씬 단순화 시켰지만 그림에는 실제로이 정확한 방정식이 반영되지 않았습니다) :

f(x)=13αlog(cosh(αa)+cosh(αx)cosh(αb)+cosh(αx))

Clunky는 알고 있지만 여기서는 가 증가함에 따라 줄에 접근 한다는 사실을 이용했습니다 .xlog(cosh(x))x

기본적으로 전환이 얼마나 부드러운 지 제어 할 수 있습니다 ( ). 경우 및 I는 (1 합) 유효한 확률 밀도의 보장. 다른 값을 선택하면 다시 정규화해야합니다.a = 2 b = 1alphaa=2b=1


다음은 R의 샘플 코드입니다.

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

f우리의 분포입니다. 일련의 순서로 플로팅합시다x

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

콘솔 출력 :

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

그리고 줄거리 :

log cosh를 기반으로 한 배포

a그리고 b대략 경사의 시작과 끝을 각각 변경할 수 있지만 추가 정규화가 필요하며 계산하지 않았습니다 (그래서 플롯을 사용 a = 2하고 있습니다 b = 1).


2

중앙 고원과 삼각형 분포의 측면을 사용하여 매우 간단한 것을 찾고 있다면 고원과 하강 ​​사이의 원하는 비율에 따라 N 삼각형 분포, N을 결합 할 수 있습니다. 샘플링 기능이 이미 대부분의 언어에 존재하기 때문에 삼각형이 필요한 이유 당신은 그들 중 하나에서 무작위로 정렬합니다.

R에서는 다음을 제공합니다.

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오


2

여기에 두 가지 로지스틱 함수의 곱이 있습니다.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

이것은 부분적으로되지 않는 이점이 있습니다.

B는 너비를 조정하고 A는 드롭 오프의 가파른 정도를 조정합니다. 아래는 A = 2 인 B = 1 : 6입니다. 참고 :이를 올바르게 정규화하는 방법을 알아내는 데 시간이 걸리지 않았습니다.

고원 분포

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.