Quantile (역 CDF) 기능을 이해하도록 도와주세요.


25

Quantile 함수에 대해 읽고 있지만 명확하지 않습니다. 아래에 제공된 것보다 더 직관적 인 설명을 제공 할 수 있습니까?

cdf 는 단조 증가하는 함수이므로 역수를 갖는다. 이것을 나타내겠습니다 . 하면 의 CDF이다 다음 값이다 되도록 ; 이것을 의 Quantile 이라고합니다 . 값 오른쪽 왼쪽의 확률 질량의 절반 반으로 분포의 중앙값이다. 값은 및 하부 및 상부 분위수이다.FF1FXF1(α)xαP(Xxα)=ααFF1(0.5)F1(0.25)F1(0.75)


당신은 수학 마크 업을 사용하는 법을 배워야합니다.
kjetil b halvorsen

6
이것은 특정 수준의 간결한 설명 모델이며 이미 예제가 포함되어 있습니다. 어떤 수준의 설명을 원하는지는 확실하지 않습니다. 모르는 것에 따라 이보다 10 배 더 길 수 있습니다. 예를 들어 CDF가 무엇인지 아십니까? '단조 증가'가 무엇을 의미하는지 아십니까? 역함수가 무엇인지 아십니까? 우리는 첫 번째 문장의 일부입니다. 귀하의 질문은 귀하가이 사실을 이해하지 못한다는 진술과 동일하며 당사는 귀하를 의심 할 이유가 없지만 정확한 질문은 아닙니다.
Nick Cox

답변:


38

이 모든 것이 처음에는 복잡하게 들릴 수 있지만 본질적으로 매우 간단한 것입니다.

누적 분포 함수로 우리는 확률이 어떤 값 보다 작거나 같은 함수를 반환합니다 .Xx

Pr(Xx)=F(x).

이 함수는 입력 x 취하여 [0,1] 간격 (확률) 에서 값을 반환합니다 ( p 로 표시) . 누적 분포 함수 (또는 Quantile 함수) 의 역수xF(x) 어떤 값 p 반환 하게 하는지 알려줍니다 .

F1(p)=x.

이는 아래 그림에서 정규 누적 분포 함수 (및 그 역)를 예로 사용합니다.

여기에 이미지 설명을 입력하십시오

간단한 예로 표준 Gumbel 배포판 을 사용할 수 있습니다 . 누적 분포 함수는

F(x)=eex

자연 대수 함수를 기억 하는 것은 지수 함수 의 역함수 이므로 Gumbel 분포에 대한 Quantile 함수가

F1(p)=ln(ln(p))

보시다시피 양자화 함수는 대체 이름에 따라 누적 분포 함수의 동작을 "반전시킵니다".

일반화 된 역 분포 함수

모든 기능에 역수가있는 것은 아닙니다. 그렇기 때문에 여러분이 언급 한 인용문에 "단일 증가 기능"이 있습니다. 함수 의 정의 에서 각 입력 값에 정확히 하나의 출력을 할당해야 함 을 상기하십시오 . 연속 랜덤 변수에 대한 누적 분포 함수는 단조 증가하므로이 특성을 만족시킵니다. 이산 랜덤 변수의 경우 누적 분포 함수가 연속적이고 증가하지 않으므로 비감 소화 가 필요한 일반화 된 역 분포 함수 를 사용합니다. 보다 공식적으로 일반화 된 역 분포 함수는 다음과 같이 정의됩니다.

F1(p)=inf{xR:F(x)p}.

평범한 영어로 번역 된 정의에 따르면 주어진 확률 값 에 대해 우리는 어떤 찾고 있는데 , 그 결과 는 보다 크거나 같은 값을 반환 하지만, 를 충족시키는 여러 값이있을 수 있기 때문에 조건 (예를 들어, 마찬가지입니다 어떤 우리가 가장 작은 걸릴 수 있도록,) 그 중입니다.pxF(x)pxF(x)0 xx

역함수가없는 함수

일반적으로 밀도 함수와 같이 다른 입력에 대해 동일한 값을 반환 할 수있는 함수에 대한 역수는 없습니다 (예 : 표준 일반 밀도 함수는 대칭이므로 및 대해 동일한 값을 반환합니다 ). 정규 분포는 또 다른 이유로 흥미로운 예입니다 . 이는 닫힌 형태의 역함수가없는 누적 분포 함수의 예 중 하나입니다 . 모든 누적 분포 함수가 닫힌 형태의 역함수 를 가질 필요는 없습니다 ! 그러한 경우에는 숫자 방법을 사용하여 역을 찾을 수 있기를 바랍니다.22

사용 사례

Quantile 함수는 역변환 방법은 어떻게 작동합니까?에 설명 된대로 임의 생성에 사용할 수 있습니다 .


2
이 답변은 두 번째 단락까지 잘 작동합니다. 당신이 거기에 도착할 때, 당신은 모든 연속적인 CDF가 역수를 가지고 있다고 주장했지만, 당신은 그 문장에 대한 반례로서 정규 분포를 제공 한 것으로 보입니다. 잠재적으로 매우 혼란 스럽습니다.
whuber

2
@ whuber 당신이 맞아서 더 명확하게하기 위해 한 문장을 추가했습니다.

2
Tim, 그리고 더 명확하게하기 위해 한 단어를 더 추가했습니다 :)
amoeba는 Reinstate Monica가

@Tim 큰 대답이지만 역 cdf 의 정의에 대해 약간의 설명을들 수 있습니까? 앞에서 언급했듯이 는 가 무엇인지 묻습니다 . 부분을 ​​다음과 같이 이해합니다 . cdf가 모노톤 증가하기 때문에 만족시키는 많은 값이 있지만 는 가장 큰 하한값을 제공합니다. 이게 말이 되요 ? F1(u)=inf{x:F(x)u}xF(x)=pinfF(x)uinf
Alexander Cska

@AlexanderCska 네, 기본적으로 여러 F (x) 값이 u보다 크므로 "이 조건을 만족하는 가장 작은 값"의 하한값을 사용합니다.
Tim

1

팀은 매우 철저한 대답을했습니다. 잘 했어!

하나 더 말하고 싶습니다. 단조 증가하는 모든 함수에 역함수가있는 것은 아닙니다. 실제로 엄격하게 단조 증가 / 감소 함수에만 역함수가 있습니다.

엄격하게 단조 증가하지 않는 단조 증가 cdf의 경우, 역 누적 분포 함수라고도하는 양자 함수가 있습니다. 자세한 내용은 여기를 참조 하십시오 .

역함수 (엄격하게 증가하는 cdf의 경우) 및 Quantile 함수 (단조 적으로 증가하지만 단조 증가하는 cdfs의 경우)는 모두 로 표시 될 수 있으며 , 때로는 혼동 될 수 있습니다.F1

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.