CDF가 PDF보다 기본입니까?


43

내 통계 전문가는 기본적으로 다음 세 가지 중 하나가 주어지면 다른 두 가지를 찾을 수 있다고 말했습니다.

  • 누적 분포 함수
  • 순간 생성 기능
  • 확률 밀도 함수

그러나 나의 계량 경제학 교수는 CDF를 가질 수 있지만 PDF가 정의되어 있지 않은 예제가 있기 때문에 CDF가 PDF보다 더 기본이라고 말했다.

CDF가 PDF보다 기본입니까? CDF에서 PDF 또는 MGF를 파생시킬 수 있는지 어떻게 알 수 있습니까?


23
이것은 일종의 기본 경쟁입니까? 유명인 심사위 원단이 있습니까? 이 세 가지 개념을 모두 사용하여 공간 에 대한 측정 값을 정의 할 수 있습니다 . 그러나 특정 CDF의 경우 PDF가 CDF의 파생으로 정의되고 MGF가 R exp ( t x ) d F ( x ) 로 정의되므로 MGF 및 PDF가 존재하지 않을 수 있으며, 이 적분이 존재할 필요는 없습니다. 그러나 이것이 이러한 개념 중 어느 것도 덜 기본적이라는 것을 의미하지는 않습니다. 기초는 수학적 정의가없는 훌륭한 형용사입니다. 중요한 동의어입니다. R아르 자형exp(엑스)에프(엑스)
mpiktas

6
@mpiktas : R n 에 대한 모든 확률 분포 는 CDF를 가지며 분포를 고유하게 정의합니다. 그러나 모든 확률 분포에 PDF 또는 MGF가있는 것은 아닙니다 (그러나 모두 고유 한 기능이 있습니다 ). 아르 자형
Ilmari Karonen

3
@mpiktas 당신은 그것을 할 수 = { R , }R . 그리고 P는 ( ( - , X ]가 ) ..? (교수 표현식 "보다 근본적인"를 사용하는 이유 그럼에도 불구하고 분명히 결정이 나에게 정의되지 않은 형용사가 더 잘 수학적 의미를 정의되지 수도 있지만, 내가 무슨 말을 몇 가지 ..) 영어도 우리가 기본 CDF를 가지고 알고 있다고 모든 PDF는 여기에 "기본", "기본"과 함께 좋은 연결을 가지고 반대는 사실이 아니다..에이={아르 자형,}아르 자형((,엑스])
drhab

2
@ drhab, 자연스럽게 나는 Radon-Nikodym 파생 상품에 대해 이야기했습니다 :) 나는 교수가 생각한 것을 너무 완벽하게 이해하지만 내 의견으로는 학생들과 함께 그러한 표현을 사용하는 것이 위험합니다. 수학적 개념은 근본성에 따라 순위를 매기려고하지만 이는 근본적으로 잘못된 것입니다. 말장난
mpiktas

4
@mpiktas : 물론“기본”에 대한 정확한 정의는 없습니다. 그러나“엄격하게 정의 된”과“완전히 의미가없는”사이에는 큰 중간 근거가 있습니다. 물론 수학 자체에서는 모든 것이 완전히 엄격해야하므로 그렇지 않은 것을 습득하는 데 매우 익숙합니다. 그러나 우리가 수학에 관해 이야기하고 생각할 때 , 우리는 다른 사람들과 마찬가지로“기본”,“일반”등과 같은 주관적인 의미의 개념을 가지고 있습니다. 그리고 괜찮습니다.
PLL

답변:


69

의 부분 집합에 대한 모든 확률 분포 에는 누적 분포 함수 가 있으며 분포를 고유하게 정의합니다. 따라서 이런 의미에서 CDF는 실제로 배포 자체만큼이나 근본적입니다.아르 자형

확률 밀도 함수는 , 그러나, 만 존재 (절대적) 연속 확률 분포 . PDF가없는 분포의 가장 간단한 예 는 정수 값만 사용하는 랜덤 변수의 분포와 같은 이산 확률 분포 입니다.

물론, 이산 확률 분포는 대신 확률 질량 함수 를 특징으로 할 수 있지만 , 연속 분포와 불연속 분포의 혼합과 같이 PDF 또는 PMF 가 없는 분포도 있습니다.

연속, 불연속 및 혼합 확률 분포 다이어그램
( 도움말Glen_b의 관련 질문에 대한 답변 에서 부끄럽게 도난당했습니다 .)

심지어있다 단수 확률 분포 예로서, 칸토어 분포 의해서도 설명 될 수 없으며, 결합 PDF 파일과 PMF의이. 그러나 이러한 배포판에는 여전히 잘 정의 된 CDF가 있습니다. 예를 들어 다음은 Cantor 배포판의 CDF이며 "악마의 계단"이라고도합니다.

캔터 배포 CDF
( 이미지 에서 위키 미디어 공용 사용자가 테온Amirki 세 이하 사용, CC-으로-SA 3.0 라이선스.)

Cantor 기능 으로 알려진 CDF 는 연속적이지만 절대적으로 연속적인 것은 아닙니다. 실제로, 그것은 0 개의 Lebesgue 측정기 의 Cantor 세트 를 제외하고 어느 곳에서나 일정 하지만, 여전히 많은 포인트를 포함합니다. 따라서 Cantor 분포의 전체 확률 질량은 실선의이 작은 부분 집합에 집중되지만 세트의 모든 점은 여전히 ​​개별적으로 0의 확률을 갖습니다.


모멘트 생성 함수 가없는 확률 분포도 있습니다 . 아마 가장 잘 알려진 예는 인 코시 분포 하는 지방 꼬리 분포는 1 차 이상의 잘 정의 된 모멘트가없는 인 (특히, 잘 정의 된 평균 또는 분산이 없음).

그러나 에 대한 모든 확률 분포 는 (복잡한 값을 갖는) 특성 함수를 가지며 , 그 정의는 허수 단위 와의 곱셈에 의해서만 MGF와 다릅니다 . 따라서, 특징적인 기능은 CDF만큼 기본적인 것으로 간주 될 수있다.아르 자형


모든 분포에는 CDF가 있지만 모두는 PDF는 없지만 실제로는 PDF가 있고 닫힌 형태의 CDF가없는 분포 (예 : 다변량 정규 분포)가 있습니다.

13
@Tim : 사실이지만 "닫힌 양식"한정자 만 사용합니다. CDF는 닫힌 형태로 쓸 수 없더라도 여전히 존재합니다. 어쨌든 " 폐쇄 형 표현 " 의 정의 는 잘 알려져 있지 않다. 일부 엄격한 정의에 따르면 일 변량 정규 분포조차도 닫힌 형태 CDF가 없지만 오류 함수 를 닫힌 형태로 간주하면됩니다 .
Ilmari Karonen

11
@Tim 반례가 아닙니다. 그것은 당신이 당신에게 중요 / 기본으로 선택한 임의의 속성입니다. 저에게는 "존재"속성이 "폐쇄 된 양식"보다 중요합니다. 더군다나 "항상 존재한다"대 "때로는 어떤 기능처럼 형태가 닫히지 않았을 수도있다".
Ark-kun

3
Cantor 세트가 "무한 점"을 갖는 것보다 더 중요한 점은 셀 수없이 많은 점이 있다는 것 입니다. 간격이 동일한 카디널리티를 갖습니다 . 따라서 0 (Lebesgue) 측정 값을 가진 구간의 셀 수없는 하위 집합입니다. 당신이 설명하는 척도는 Cantor 세트의 셀 수있는 서브셋에서 0이고 (일부) 셀 수없는 서브셋에서 0이 아니라는 점에서 비슷합니다.[0,1]아르 자형
Eric Towers

1
@ Ark-kun 저는 PDF가 CDF보다 "직접 사용 가능한"경우가 있기 때문에 여기에서 악마 옹호자를하고 있습니다. 나는이 대답을 좋아하지만 (+1) IMHO, 이것은 또한 언급 할 수있는 것입니다.
Tim

16

계량 경제학 교수가 다음과 같은 생각을하고 있다고 생각합니다.

고려 함수 domiain하여 [ 0 , 1 ] 에서 정의한에프[0,1]

F(X)=1

에프(엑스)=12엑스 ...에 대한 엑스<12
에프(엑스)=12엑스+12 ...에 대한 엑스12

[0,1]

({12})=12

에프

에프

PDF의 정의에 따르면

0엑스에프()=에프(엑스)에프(0)=14엑스

0<엑스<12

에프(엑스)=14 ...에 대한 엑스<12

같은 방식으로 시작하지만 1부터 시작하여 0으로 이동하고 에서 끝나는 적분엑스>12

에프(엑스)=14 ...에 대한 엑스>12

에프에프(12)에프(12)

({12})=12

우리는 필요하게 될 것이다

12ϵ12+ϵ에프()>12

포함하는 모든 간격에 대해12

12ϵ12+ϵ에프()=12ϵ12+ϵ14=12ϵ

에프

PDF의 개념을 복구 할 수 있지만 측정 또는 분포 와 같은 보다 정교한 수학적 개체를 사용해야합니다 .


3
12δ(엑스12)δ(엑스)엑스=0
+δ(엑스)엑스=1

2
1

whuber가 말한 것은 내가 마지막 줄에서 암시했던 것입니다. 나는 "배포"라는 단어를 사용했다.
Matthew Drury

4
1/21/2

4

Ilmari는 이론적 인 관점에서 좋은 답변을 제공합니다. 그러나 밀도 (pdf)와 분포 함수 (pdf)가 실제 계산에 어떤 용도로 사용되는지 물어볼 수도 있습니다. 이것은 어떤 상황이 다른 상황보다 더 직접적으로 유용한지를 명확히 할 수 있습니다.

아르 자형(,엑스]

그러나 가능성은 밀도 측면에서 정의되므로 밀도는 통계에 필수적입니다. 따라서 최대 우도 추정치를 계산하려면 밀도가 직접 필요합니다.

경험적 분포와 이론적 분포를 비교하면 둘 다 유용 할 수 있지만 분포 함수를 기반으로하는 pp- 및 qq-plots와 같은 방법이 종종 선호됩니다.

아르 자형2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.