내 통계 전문가는 기본적으로 다음 세 가지 중 하나가 주어지면 다른 두 가지를 찾을 수 있다고 말했습니다.
- 누적 분포 함수
- 순간 생성 기능
- 확률 밀도 함수
그러나 나의 계량 경제학 교수는 CDF를 가질 수 있지만 PDF가 정의되어 있지 않은 예제가 있기 때문에 CDF가 PDF보다 더 기본이라고 말했다.
CDF가 PDF보다 기본입니까? CDF에서 PDF 또는 MGF를 파생시킬 수 있는지 어떻게 알 수 있습니까?
내 통계 전문가는 기본적으로 다음 세 가지 중 하나가 주어지면 다른 두 가지를 찾을 수 있다고 말했습니다.
그러나 나의 계량 경제학 교수는 CDF를 가질 수 있지만 PDF가 정의되어 있지 않은 예제가 있기 때문에 CDF가 PDF보다 더 기본이라고 말했다.
CDF가 PDF보다 기본입니까? CDF에서 PDF 또는 MGF를 파생시킬 수 있는지 어떻게 알 수 있습니까?
답변:
의 부분 집합에 대한 모든 확률 분포 에는 누적 분포 함수 가 있으며 분포를 고유하게 정의합니다. 따라서 이런 의미에서 CDF는 실제로 배포 자체만큼이나 근본적입니다.
확률 밀도 함수는 , 그러나, 만 존재 (절대적) 연속 확률 분포 . PDF가없는 분포의 가장 간단한 예 는 정수 값만 사용하는 랜덤 변수의 분포와 같은 이산 확률 분포 입니다.
물론, 이산 확률 분포는 대신 확률 질량 함수 를 특징으로 할 수 있지만 , 연속 분포와 불연속 분포의 혼합과 같이 PDF 또는 PMF 가 없는 분포도 있습니다.
( 도움말 은 Glen_b의 관련 질문에 대한 답변 에서 부끄럽게 도난당했습니다 .)
심지어있다 단수 확률 분포 예로서, 칸토어 분포 의해서도 설명 될 수 없으며, 결합 PDF 파일과 PMF의이. 그러나 이러한 배포판에는 여전히 잘 정의 된 CDF가 있습니다. 예를 들어 다음은 Cantor 배포판의 CDF이며 "악마의 계단"이라고도합니다.
( 이미지 에서 위키 미디어 공용 사용자가 테온 과 Amirki 세 이하 사용, CC-으로-SA 3.0 라이선스.)
Cantor 기능 으로 알려진 CDF 는 연속적이지만 절대적으로 연속적인 것은 아닙니다. 실제로, 그것은 0 개의 Lebesgue 측정기 의 Cantor 세트 를 제외하고 어느 곳에서나 일정 하지만, 여전히 많은 포인트를 포함합니다. 따라서 Cantor 분포의 전체 확률 질량은 실선의이 작은 부분 집합에 집중되지만 세트의 모든 점은 여전히 개별적으로 0의 확률을 갖습니다.
모멘트 생성 함수 가없는 확률 분포도 있습니다 . 아마 가장 잘 알려진 예는 인 코시 분포 하는 지방 꼬리 분포는 1 차 이상의 잘 정의 된 모멘트가없는 인 (특히, 잘 정의 된 평균 또는 분산이 없음).
그러나 에 대한 모든 확률 분포 는 (복잡한 값을 갖는) 특성 함수를 가지며 , 그 정의는 허수 단위 와의 곱셈에 의해서만 MGF와 다릅니다 . 따라서, 특징적인 기능은 CDF만큼 기본적인 것으로 간주 될 수있다.
계량 경제학 교수가 다음과 같은 생각을하고 있다고 생각합니다.
고려 함수 domiain하여 [ 0 , 1 ] 에서 정의한
F(X)=1
PDF의 정의에 따르면
같은 방식으로 시작하지만 1부터 시작하여 0으로 이동하고 에서 끝나는 적분
우리는 필요하게 될 것이다
포함하는 모든 간격에 대해
Ilmari는 이론적 인 관점에서 좋은 답변을 제공합니다. 그러나 밀도 (pdf)와 분포 함수 (pdf)가 실제 계산에 어떤 용도로 사용되는지 물어볼 수도 있습니다. 이것은 어떤 상황이 다른 상황보다 더 직접적으로 유용한지를 명확히 할 수 있습니다.
그러나 가능성은 밀도 측면에서 정의되므로 밀도는 통계에 필수적입니다. 따라서 최대 우도 추정치를 계산하려면 밀도가 직접 필요합니다.
경험적 분포와 이론적 분포를 비교하면 둘 다 유용 할 수 있지만 분포 함수를 기반으로하는 pp- 및 qq-plots와 같은 방법이 종종 선호됩니다.