일반적으로 불연속 변수에 대한 확률 분포는 확률 질량 함수 (PMF)를 사용하여 설명됩니다.
연속 랜덤 변수로 작업 할 때 확률 질량 함수가 아닌 확률 밀도 함수 (PDF)를 사용하여 확률 분포를 설명합니다.
- 깊은 학습 Goodfellow, Bengio 및 Courville로
그러나 Wolfram Mathworld 는 이산 변수에 대한 확률 분포를 설명하기 위해 PDF를 사용하고 있습니다.
이것은 실수입니까? 아니면별로 중요하지 않습니까?
일반적으로 불연속 변수에 대한 확률 분포는 확률 질량 함수 (PMF)를 사용하여 설명됩니다.
연속 랜덤 변수로 작업 할 때 확률 질량 함수가 아닌 확률 밀도 함수 (PDF)를 사용하여 확률 분포를 설명합니다.
- 깊은 학습 Goodfellow, Bengio 및 Courville로
그러나 Wolfram Mathworld 는 이산 변수에 대한 확률 분포를 설명하기 위해 PDF를 사용하고 있습니다.
이것은 실수입니까? 아니면별로 중요하지 않습니까?
답변:
실수는 아닙니다. 공식적인 확률 처리에서 측정 이론을 통해 확률 밀도 함수 는 "우수 측정"( "기준 측정"이라고도 함)과 관련하여 취한 확률 측정의 파생물입니다. 정수에 대한 이산 분포의 경우 확률 질량 함수는 계수 측정 과 관련된 밀도 함수입니다 . 확률 질량 함수는 특정 유형의 확률 밀도 함수이므로 때때로 밀도 함수라고하는 이와 같은 참조를 찾을 수 있으며 이런 식으로 참조하는 것은 잘못이 아닙니다.
확률과 통계에 관한 일반적인 담론에서, 종종이 용어를 피하고, 이산 분포와 연속 분포를 구별하기 위해 "질량 함수"(이산 랜덤 변수의 경우)와 "밀도 함수"(연속 랜덤 변수의 경우)를 구별합니다. 다른 맥락에서, 확률의 전체 론적 측면을 진술하는 경우, 종종 구별을 무시하고 "밀도 함수"로 지칭하는 것이 더 낫습니다.
treatment평균 표기법, 관점, 규칙 또는 뭔가 다른 "확률의 공식적인 치료에?"
측정 이론 측면에서보다 이론적 인 답변 외에도 통계 프로그래밍에서 pmf와 pdf를 구분하지 않는 것이 편리합니다. 예를 들어, R에는 다양한 기본 제공 배포판이 있습니다. 각 분포마다 4 가지 기능이 있습니다. 예를 들어, 정규 분포 (도움말 파일에서)의 경우 :
dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.
R 사용자는 d,p,q,r접두사 를 빠르게 사용합니다 . 이항 분포 d와 같은 드롭 앤 드롭 과 같은 것을 사용해야 m한다면 성 가실 것입니다. 대신 R 사용자가 기대하는 모든 것이 있습니다.
dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
scipy.stats구별하기 위해 일부 객체에는 pdf메소드가 있고 다른 객체에는 pmf메소드가 있습니다. 정말 짜증나!