변형 된 변수의 밀도에 대한 직관적 인 설명?


37

가 pdf 의 랜덤 변수 라고 가정 합니다. 그런 다음 임의 변수 는 pdf를 갖습니다.XfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

나는 이것 뒤에 미적분학을 이해합니다. 그러나 나는 미적분학을 모르는 사람에게 그것을 설명하는 방법을 생각하려고합니다. 특히, 나는 요소가 왜 먼저 나타나는지 설명하려고합니다 . 나는 그것을 찌를 것이다 :1y

에 가우스 분포가 있다고 가정합니다 . PDF의 거의 모든 가중치는 과 사이의 값 사이에 있습니다. 그러나 0에서 9까지 매핑됩니다 . 따라서 에 대한 pdf의 중량 이 로의 변환에서 더 넓은 범위의 값으로 확장되었습니다 . 따라서 가 실제 pdf가 되려면 곱셈 계수 의해 추가 중량이 가중되어야합니다.X33.YXYfY(y)1y

그 소리는 어때?

누구든지 자신에 대한 더 나은 설명을 제공하거나 문서 또는 교과서에있는 링크를 제공 할 수 있다면 대단히 감사하겠습니다. 이 변수 변환 예제는 몇 가지 소개 수학 확률 / 통계 서적에서 찾을 수 있습니다. 그러나 나는 그것에 대한 직관적 인 설명을 찾지 못했습니다 :(


귀하의 설명이 정확하다고 생각합니다.
highBandWidth

2
설명은 옳습니다. 그러나 그것은 정 성적입니다. 곱셈 요소의 정확한 형태는 여전히 미스터리입니다. -1/2의 힘은 단순히 마법처럼 보입니다. 따라서 어떤 수준에서는 미적분 함수와 동일한 작업을 수행해야합니다. 제곱근 함수의 변화율을 찾으십시오.
whuber

답변:


37

PDF는 높이이지만 면적을 기준으로 확률을 나타내는 데 사용됩니다. 따라서 면적이 높이와 기본 거리임을 상기시키는 방식으로 PDF를 표현하는 데 도움이됩니다.

초기에 임의의 값 에서의 높이는 PDF 됩니다. 밑은 무한대 세그먼트 이며, 분포 (즉, 분포 함수 와 반대되는 확률 측정 )가 실제로 미분 형태 또는 "확률 요소"인 경우xfX(x)dx

PEX(x)=fX(x)dx.

이것은 PDF가 아니라 확률 적으로 표현하는 데 필요한 모든 요소를 명시 적으로 포함하기 때문에 개념적으로나 실제적으로 작업하려는 객체 입니다.

를 다시 표현 하면 기본 세그먼트 가 늘어나거나 눌려집니다. 에서 까지 간격의 양쪽 끝을 제곱 하여 영역 의 기본 이 길이의 간격xy=x2dxxx+dxy

dy=(x+dx)2x2=2xdx+(dx)2.

두 개의 무한대의 곱은 무한한 그 자체와 비교하여 무시할 수 있기 때문에 결론

dy=2xdx, whence dx=dy2x=dy2y.

이것을 설정하면 새로운 높이와 새로운 너비를 꽂기 때문에 계산이 간단합니다.

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

와 관련하여 밑 이 이므로 곱하면 무엇이든지 높이가되어야합니다. 중간 용어를 다음과 같이 직접 읽을 수 있습니다ydy

12yfX(y)=fY(y).

이 방정식 는 사실상 면적 (= 확률) 법칙보존입니다.PEX(x)=PEY(y)

두 개의 PDF

이 그래픽은 와 관련된 두 개의 PDF의 좁은 (거의 무한한) 조각을 정확하게 보여줍니다 . 확률은 음영 영역으로 표시됩니다. 제곱을 통한 간격 의 압착으로 인해 빨간색 영역의 높이 ( 왼쪽의 )가 파란색 영역의 영역 ( 오른쪽의 )에 맞게 비례 적으로 확장되어야합니다 .y=x2[0.32,0.45]yx


2
나는 무한한 것을 좋아합니다. 이것은 훌륭한 설명입니다. 의 관점에서 생각 명확하게 변환의 미분에서 나오는 것을 볼 수있다,의 관점에서 생각보다 훨씬 더 직관적 . 나는 그것이 내 고집 포인트가었던 곳이라고 생각합니다. 2xy
lowndrul

@ whuber, 첫 줄은 여야한다고 생각합니다 . 이것이 입니까? 추신 : 또한 내 대답에 대한 당신의 생각이 궁금합니다 (아래). pdf X ( x )P(X(x,x+dx))=fx(x)dxpdfX(x)
카를로스시 넬리

@Carlos 처음부터 내가 한 방식으로 아이디어를 표현하는 것이 좀 더 엄격합니다. PDF는 주어진 확률 측정 값을 얻기 위해 Lebesgue 측정 값 를 곱한 것입니다. dx
whuber

@ whuber이지만 pdf가 곱하면 라는 용어입니다. 쓴 아닙니다 . 왜 제품 를 pdf 라고 부르는지 확실하지 않습니다 . fX(x)fx(x)dxfX(x)dx
카를로스시 넬리

1
@Carlos : 감사합니다. 지금 당신의 요점을 참조하십시오. 나는 그것을 해결하기 위해 약간의 편집을했다.
whuber

11

항상 정사각형 인 물체를 제조 하고 정사각형의 측면 길이 분포를 알고 있다면 어떨까요? 사각형의 면적 분포에 대해 무엇을 말할 수 있습니까?

특히, 임의 변수 의 분포를 알고 있다면 대해 무엇을 말할 수 있습니까? 당신이 말할 수있는 한 가지는XY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

따라서 CDF와 의 CDF 사이에 관계가 설정됩니다 . 그들의 PDF 사이의 관계는 무엇입니까? 이를 위해서는 미적분학이 필요합니다. 양쪽의 도함수를 취하면 원하는 결과를 얻을 수 있습니다.YX


2
(+1) 이것이 정답은 아니지만 를 찾는 좋은 방법을 제시하고 왜 각 제곱근에 대해 두 조각의 합인지를 명확하게 보여줍니다. fY
whuber

1
왜 pdf (x) = f (x) dx인지 모르겠습니다. pdf (x) dx = f (x)는 density = prob mass/interval어떻습니까? ... 무엇이 잘못됩니까?
Fernando

2

인구가 있고 가 해당 인구의 요약이라고 상상해보십시오 . 그런 다음 는 범위에서 가변 를 가진 개인의 비율을 계산합니다 . 이것을 크기 의 "빈"으로 간주 할 수 있으며 해당 빈 안에 몇 명의 개인이 있는지 계산합니다.YP(Y(y,y+Δy))Y(y,y+Δy)Δy

이제 다른 변수 관점에서 개인을 다시 표현해 봅시다 . 와 가 와 관련이 있다는 것을 알고 있다면 , 이벤트 은 이벤트 이벤트 . 따라서 저장소 에있는 개인도 저장소 및 있어야합니다. . 다시 말해, 그 쓰레기통은 같은 비율의 개인이어야합니다.XYXY=X2Y(y,y+Δy)X2(x2,(x+Δx)2)X(|x|,|x|+Δx) or X(|x|Δx,|x|)(y,y+Δy)(|x|,|x|+Δx)(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

자 이제 밀도에 도달합시다. 먼저 확률 밀도 가 무엇인지 정의해야합니다 . 이름에서 알 수 있듯이 지역 당 개인의 비율입니다 . 즉, 우리그 쓰레기통에있는 개인의 비율을 세어 쓰레기통크기로 나눕니다 . 여기서 사람들의 비율은 동일하지만 쓰레기통의 크기가 바뀌 었으므로 밀도가 다를 것이라고 결론을 내 렸습니다. 그러나 얼마나 다른가?

우리는 상기 된 바와 같이, 확률 밀도 따라서 밀도 빈의 크기에 의해 나누어 진 빈 사람의 비율이고 주어진다 . 유사하게, 의 확률 밀도는 로 주어집니다 .YfY(y):=P(Y(y,y+Δy))ΔyXfX(x):=P(X(x,x+Δx))Δx

이전 결과에서 각 빈의 인구가 동일하다는 것을 알았습니다.

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

즉, 밀도 인자에 의해 변경 연신의 상대적 크기, 또는 빈 크기를 짜는 것. 이 경우 이므로 입니다. 경우 우리가 무시해 작은 충분히 내포 및 이므로 가 변환에 나타납니다.fX(y)+fX(y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.