pdf와 pmf 및 cdf에 동일한 정보가 포함되어 있습니까?


17

pdf와 pmf 및 cdf에 동일한 정보가 포함되어 있습니까?

나를 위해 pdf는 특정 지점 (기본적으로 확률 아래의 영역)에 전체 확률을 제공합니다.

pmf는 특정 지점의 확률을 제공합니다.

cdf는 특정 지점에서 확률을 제공합니다.

나에게 pdf와 cdf는 같은 정보를 가지고 있지만 pmf는 분포에 대한 점 x을 가질 확률을 제공하지 않기 때문에 그렇지 않습니다 .

답변:


25

확률 함수와 밀도 *를 구별 할 경우 pmf는 이산 랜덤 변수에만 적용되는 반면 pdf는 연속 랜덤 변수에 적용됩니다.

* 공식적인 접근법은 둘 다를 포괄하고 단일 용어를 사용할 수 있습니다

cdf는 pdf 또는 pmf가없는 변수를 포함하여 임의의 변수에 적용됩니다.

여기에 이미지 설명을 입력하십시오

( 혼합 배포 는 pdf 또는 pmf가없는 배포의 유일한 사례는 아니지만 하루에 비가 내리거나 청구 금액을 청구하는 등의 합리적 상황입니다. 부동산 보험 정책 (둘 중 하나가 0으로 팽창 된 연속 분포로 모델링 될 수 있음)

랜덤 변수 의 cdf 는XP(Xx)

불연속 랜덤 변수 대한 pmf 는 합니다.XP(X=x)

pdf 자체는 확률을 제공하는 것이 아니라 상대적인 확률을 제공합니다. 연속 분포에는 점 확률이 없습니다. PDF에서 확률을 얻으려면 일정한 간격으로 통합하거나 두 cdf 값의 차이를 가져와야합니다.

'동일한 정보를 포함하고 있습니까?'라는 질문에 답하기는 어렵습니다. 왜냐하면 그것이 의미하는 바에 달려 있기 때문입니다. pmf 또는 pdf가 존재하는 경우 pdf에서 cdf (통합을 통해), pmf에서 cdf (요약을 통해), cdf에서 pdf (차별을 통해) 및 cdf에서 pmf (차이를 통해)로 이동할 수 있습니다. cdf와 동일한 정보를 포함합니다.


1
글렌, "pdf 관련 확률"에 관해 읽을 수있는 참고 자료를 제공해 주시겠습니까? 매우 흥미롭고 내 책에서 본 것을 기억하지 않습니다. 감사.
Alecos Papadopoulos

그것은 동안 단순히 사실의 (아마도 가난하게 말로) 설명입니다 @Alecos 확률, 이후 아니다 에있는의 확률 , 다음 F ( X ) / g ( X ) 농도의 변수 확률의 비로서 생각 될 수 f는 매우 짧은 거리 내 X 밀도와 가변하는 비율 g는 동일한 간격이다. 그런 의미에서 '상대적 확률'을 나타냅니다. f(x)f(x)dx(x,x+dx)f(x)/g(x)fxg
Glen_b-복지 모니카

내가 참조. 그것은 확률의 비율의 근사치로 확실히 유효하며, 필요에 의해 별개의 것이 존재하는 경험적 밀도 함수에 확실히 존재합니다.
Alecos Papadopoulos 1

10

PMF는 이산 랜덤 변수, 연속 랜덤 변수가있는 PDF와 연관됩니다. 들면 모든 랜덤 변수의 임의의 유형의 CDF가 항상 존재한다 (그리고 고유)로 정의 이제 랜덤 변수 X 의 지원 세트에 따라 밀도 (또는 질량 함수)가 필요하지 않습니다. ( Cantor Set 및 Cantor Function을 고려하면 단위 간격의 중앙 1/3을 제거한 다음 간격 (0, 1/3) 및 (2/3, 1)에 대한 절차를 반복하여 세트를 반복적으로 정의합니다. 이 함수는 C ( x

FX(x)=P{Xx}.
X , 경우 x는 선창자 세트이며, 경우에 가장 큰이 캔터 설정에 하한 x는 구성원이 아닙니다.) 선창자 기능이 완벽하게 좋은 분포 함수이며, 만약 당신이 압정에서 C ( X ) = 0 의 경우 1 < x 인 경우 x < 0 이고 C ( x ) = 1 입니다. 그러나이 cdf는 밀도가 없습니다 : C ( x ) 는 모든 곳에서 연속적이지만 그 파생물은 거의 모든 곳에서 0입니다. 유용한 측정과 관련하여 밀도가 없습니다.C(x)=xxxC(x)=0x<0C(x)=11<xC(x)

따라서, 귀하의 질문에 대한 대답은,되는 경우 밀도 질량 함수가 존재, 그것은 어느 정도 관련하여 CDF의 파생입니다. 그런 의미에서 그들은 "같은"정보를 가지고 있습니다. 그러나 PDF 및 PMF는 존재하지 않아도됩니다. CDF가 존재해야합니다.


2
데니스, " 아무것도 측정 할 수없는 밀도 "라는 문구가 무슨 뜻인지 알 수 있습니까? 확실히 그 자체와 관련하여 밀도 (균일!)가 있습니다.
추기경

@ cardinal : 시도해 볼 것이지만, 실제 분석을 연구하지 않으면 그것이 의미가 있음을 모르겠습니다. 수학 통계에 대한 오래된 책 (예 : Freund 's Mathematical Statistics )을 보면 PMF가 "밀도"라고 표시됩니다. "밀도"라는 이름 은 측정 가능한 공간 의 확률 측정 에 의해 정당화됩니다 ( Ω , σ ( Ω ) , μ ) 는 CDF의 기초입니다 (Joel의 의견 참조). 밀도는 일부 측정 값 (일반적으로 Lesbesgue 측정 값 또는 계수 측정 값)과 관련하여 μ 의 Radon-Nikodym 유도체입니다 . 이 경우 C ( x )μ(Ω,σ(Ω),μ)μC(x)RN 유도체가 없습니다.
Dennis

3
@cardinal (continued) : Cantor Set에서 확률 측정 값은 균일하지만, 대수의 모양이 확실하지 않은 이상한 짐승입니다 . 아마도 "유용한 수단에 대한 밀도는 없다"고 말했을 것입니다. σ
Dennis

2

다른 답변은 CDF가 기본적이고 존재해야한다는 사실을 지적하는 반면, PDF와 PMF는 반드시 존재하는 것은 아니며 반드시 존재하지는 않습니다.

샘플 공간이 정렬되지 않았을 때 CDF를 해석하는 방법 (또는 존재하는 방법)을 알지 못했기 때문에 혼란스럽고 흥미 롭습니다 (비 통계 전문가). 원은, 예를 들어, 생각 .S1

답은 기본 함수가 확률 측정 이라는 것인데, 이는 샘플 공간의 각 (고려 된) 서브 세트를 확률에 매핑합니다. 그런 다음 존재하는 경우 CDF, PDF 및 PMF는 확률 측정 값에서 발생합니다.


1
내가 본 것처럼 대부분의 교과서는 "무작위 변수"를 샘플 공간에서 실수로의 매핑으로 정의합니다. 기본적으로 "무작위 변수"는 실제 값입니다.
Neil G

1
(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.