일 변량 랜덤 변수의 평균이 항상 Quantile 함수의 적분과 동일합니까?

17

단 변량 랜덤 변수의 Quantile 함수 (역 cdf)를 p = 0에서 p = 1로 통합하면 변수의 평균이 생성됨을 알았습니다. 나는 지금까지 이러한 관계에 대해 들어 본 적이 없으므로 궁금합니다. 이것이 항상 그렇습니까? 그렇다면이 관계가 널리 알려져 있습니까?

다음은 파이썬의 예입니다.

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

mean pdf quantile-function

— 타일러 스트리트
소스

26

하자 $F$ 임의 변수의 CDF 수 $X$ CDF 역 기록 할 수 있도록, $F^{-1}$ . 적분에서 $p = F(x)$ , $dp = F'(x)dx = f(x)dx$ 로 대입하여

\int_{0}^{1} F^{- 1} (p) d p = \int_{- \infty}^{\infty} x f (x) d x = E_{F} [X] .

$\int_0^1F^{-1}(p)dp = \int_{-\infty}^{\infty}x f(x) dx = \mathbb{E}_F[X].$

이는 연속 배포에 유효합니다. 역 CDF는 고유 한 정의가 아니기 때문에 다른 분포에주의해야합니다.

편집하다

변수가 연속적이지 않은 경우, 역 CDF의 정의에주의를 기울이고 계산 적분에주의를 기울여야하는 Lebesgue 측정과 관련하여 절대적으로 연속적인 분포가 없습니다. 예를 들어 불연속 분포의 경우를 고려하십시오. 정의에 따르면, 이는 CDF $F$ 가 각각의 가능한 값 에서 크기 단계를 가진 단계 함수 인 것입니다 . $\Pr_F(x)$ $x$

그림 1

이 도면에 도시하는 베르누이의 CDF는 분배에 의해 스케일 . 즉, 임의의 변수를 갖는 확률 같게의 과 확률 같게의 . 과 의 점프 높이는 확률을 제공합니다. 이 변수의 기대치는 . $(2/3)$ $2$ $1/3$ $0$ $2/3$ $2$ $0$ $2$ $0\times(1/3)+2\times(2/3)=4/3$

"inverse CDF" 함으로써 $F^{-1}$

F^{- 1} (p) = x if F (x) \geq p and F (x^{-}) < p .

$F^{-1}(p) = x \text{ if } F(x) \ge p \text{ and } F(x^{-}) \lt p.$

이는 도 단계 함수 임을 의미합니다 . 가능한 모든 값 $F^{-1}$ 랜덤 변수, 값에 도달한다 길이의 간격 . 따라서 적분은 값 를 합산하여 얻을 수있습니다. $x$ $F^{-1}$ $x$ $\Pr_F(x)$ $x\Pr_F(x)$

그림 2

이것은 앞의 예에서 역 CDF의 그래프입니다. 점프의 및 CDF의 높이가 이들 길이의 수평 라인이 동일하게 과 , 그 확률을 해당하는 값. (역 CDF는 간격을 넘어 정의되지 ). 그 적분 개의 직사각형 높이의 하나의 합 베이스 , 높이가 다른 베이스 으로 총 $1/3$ $2/3$ $0$ $2$ $[0,1]$ $0$ $1/3$ $2$ $2/3$ $4/3$ , 이전과.

일반적으로 연속 분포와 불연속 분포의 혼합의 경우이 구성과 평행을 이루도록 역 CDF를 정의해야합니다. 각 개별 높이 점프 에서 앞의 공식에 따라 길이 의 가로 선을 형성해야합니다 . $p$ $p$

— 우버
소스

변수 변경에 실수를했습니다. x는 어디에서 오는가?

— 마스카 르포 네

3

@Mascarpone 방정식 앞의 텍스트를 읽으십시오. 변수의 변경에 실수가 없다고 생각합니다 :-) 설명을 명확하게 할 것이라고 생각한다면

이면

. 나는 그것이 필요하다고 생각하지 않았습니다.

p = F (x)

$p=F(x)$

x = F^{- 1} (p)

$x=F^{-1}(p)$

— whuber

지금 나는 그것을 얻었다;)

— 마스카 르포 네

+1 Whuber : 감사합니다! 제공 한 공식을 사용하기 위해 역 CDF에 고유 한 정의가없는 다른 분포를 관리하는 방법을 자세히 설명해 주시겠습니까?

— 모든

1

역수, 의사 역수 등에 대한 이러한 불안전 한 고려 사항을 무시하고 동시에 모든 순간에 일반화하려면 여기를 참조 하십시오 .

— 나요

9

동등한 결과는 생존 분석 에서 잘 알려져 있습니다 . 예상 수명은 여기서 는 생존 함수가 에서 태어 났을 때 측정 된 이다. ( 음수 값을 포함하도록 쉽게 확장 할 수 있습니다.)

\int_{t = 0}^{\infty} S (t) d t

$\int_{t=0}^\infty S(t) \; dt$

S (t) = Pr (T > t)

$S(t) = \Pr(T \gt t)$

t = 0

$t=0$

t

$t$

enter image description here

따라서 이것을 로 다시 쓸 수 있습니다 그러나 이것은

\int_{t = 0}^{\infty} (1 - F (t)) d t

$\int_{t=0}^\infty (1-F(t)) \; dt$

해당 지역의 다양한 반사에 나타난

\int_{q = 0}^{1} F^{- 1} (q) d q

$\int_{q=0}^1 F^{-1}(q) \; dq$

enter image description here

— 헨리
소스

1

나는 그림을 좋아하고 본능적으로 여기에 숨어있는 좋은 아이디어가 있다고 생각합니다. 나는 그 아이디어를 좋아 합니다. 그러나 저는이 특정 것들을 이해하지 못합니다. 설명이 도움이 될 것입니다. 내 트랙에서 저를 정지 한 가지의 중요한 확장하는 노력의 생각입니다

에

: 그것은 적 분산에있다.

(1 - F (t)) d t

$(1-F(t))dt$

- \infty

$-\infty$

— whuber

@whuber : 당신이 부정적으로 확장 할 경우

, 당신의 get

t

$t$

. 참고 그것에 대해 유통 대칭이 수렴 경우

, 즉

다음은 기대가 제로하다는 것을 쉽게 알 수있다. 차이가 아닌 합을 취하기

\int_{t = 0}^{\infty} (1 - F (t)) d t - \int_{t = - \infty}^{0} F (t) d t

$\int_{t=0}^\infty (1-F(t)) \; dt - \int_{t=-\infty}^0 F(t) \; dt$

0

$0$

F (t) = 1 - F (- t)

$F(t)=1-F(-t)$

는 약

의 평균 절대 편차를 제공합니다.

\int_{t = 0}^{\infty} (1 - F (t)) d t + \int_{t = - \infty}^{0} F (t) d t

$\int_{t=0}^\infty (1-F(t)) \; dt + \int_{t=-\infty}^0 F(t) \; dt$

0

$0$

— Henry

다이어그램이 마음에 들면 Lee의이 1988 년 논문 : 손실 초과 범위의 수학 및 회고 적 평가-그래픽 접근 방식에 관심이있을 수 있습니다 .

— Avraham

4

우리는 평가하고 있습니다 :

enter image description here

간단한 변수 변경으로 시도해 봅시다.

enter image description here

그리고 PDF와 CDF의 정의에 따르면 :

enter image description here

거의 모든 곳에서. 따라서 우리는 기대 가치의 정의에 따라

enter image description here

— 마스카 르포 네
소스

마지막 줄에는 기대 값의 정의를 더 명확하게 설명합니다. 거의 모든 곳이 마지막 방정식 위의 방정식을 나타냅니다. en.wikipedia.org/wiki/Almost_everywhere

— 마스카 르포 네

1

편집, 고맙습니다 :)

— Mascarpone

3

$X$ $F$ $F^{-1}(U)$ $X$ $U$ $(0,1)$ $X$ $F^{-1}(U)$

E (X) = E (F^{- 1} (U)) = \int_{0}^{1} F^{- 1} (u) d u .

$E(X)=E(F^{-1}(U))=\int_0^1 F^{-1}(u)\mathrm{d}u.$ The representation

X \sim F^{- 1} (U)

$X \sim F^{-1}(U)$ holds for a general cdf

F

$F$ , taking

F^{- 1}

$F^{-1}$ to be the left-continuous inverse of

F

$F$ in the case when

F

$F$ it is not invertible.

— Stéphane Laurent
소스

1

Note that $F(x)$ is defined as $P(X\le x)$ and is a right-continuous function. $F^{-1}$ is defined as

F^{- 1} (p) = min (x | F (x) \geq p) .

$\begin{equation} F^{-1}(p)=\min(x|F(x)\ge p). \end{equation}$ The

min

$\min$ makes sense because of the right continuity. Let

U

$U$ be a uniform distribution on

[0, 1]

$[0, 1]$ . You can easily verify that

F^{- 1} (U)

$F^{-1}(U)$ has the same CDF as

X

$X$ , which is

F

$F$ . This doesn't require

X

$X$ to be continuous. Hence,

E (X) = E (F^{- 1} (U)) = \int_{0}^{1} F^{- 1} (p) d p

$E(X)=E(F^{-1}(U))=\int_0^1F^{-1}(p)\mathop{dp}$ . The integral is the Riemann–Stieltjes integral. The only assumption we need is the mean of

X

$X$ exists (

E | X | < \infty

$E|X|<\infty$ ).

— WWang
소스

That's the same answer as mine.

— Stéphane Laurent