경험적 CDF 대 CDF


21

경험적 누적 분포 함수에 대해 배우고 있습니다. 하지만 난 여전히 이해가 안돼

  1. 왜 '실증적'이라고 불리는가?

  2. 경험적 CDF와 CDF간에 차이가 있습니까?


2
여기를 확인하십시오 stats.stackexchange.com/questions/222120/…
Tim

박스 모델티켓 측면에서 간단하고 간단하며 우아한 설명이 있습니다 . CDF는 원래 박스에 무엇이 있는지 설명합니다. ECDF는 샘플 (원래 상자에서 가져온 일련의 티켓 인 소위 "임시"데이터)을 빈 상자에 넣을 때 얻을 수있는 것입니다.
whuber

한 가지 알아야 할 것은 경험적 분포는 일반적으로 그것이 구성되는 방식에 의해 제한되지만 CDF는 그렇지 않을 수도 있다는 것입니다. 예를 들어, 포아송 변수의 관측치로부터 경험적 CDF를 구축하면 획득 한 ECDF는 가장 높은 관측 빈도에 의해 제한되고 실제 CDF는 제한되지 않습니다.
Aksakal

답변:


27

하자 임의의 변수가 될.X

  • 누적 분포 함수 는 합니다.F(x)P(Xx)
  • 경험적 누적 분포 함수 함수 는 표본의 관측치에 따라 를 제공합니다.G(x)P(Xx)

차이점은 사용되는 확률 측정입니다. 경험적 CDF의 경우 경험적 샘플의 빈도 수로 정의 된 확률 측정 값을 사용합니다.

간단한 예 (코인 플립) :

는 단일 동전 뒤집기의 결과를 나타내는 임의의 변수로 가정하십시오. 여기서 은 머리를 나타내고 은 꼬리를 나타냅니다.XX=1X=0

공정한 동전에 대한 CDF는 다음과 같이 제공됩니다 :

F(x)={0for x<012for 0x<11for 1x

머리 2 개와 꼬리 1 개를 뒤집 으면 경험적 CDF는 다음과 같습니다.

G(x)={0for x<023for 0x<11for 1x

경험적 CDF는 샘플에서 플립의 가 헤드 임을 반영합니다 .2/3

다른 예 ( 는 정규 분포의 경우 CDF 임) :F

하자 평균과 정규 분포 확률 변수 수 , 표준 편차 .X01

CDF는 다음과 같이 제공됩니다.

F(x)=x12πex22

3 개의 IID 드로우가 있고 값을 얻었습니다 . 경험적 CDF는 다음과 같습니다. x1<x2<x3

(와이)={0...에 대한 와이<엑스11...에 대한 엑스1와이<엑스22...에 대한 엑스2와이<엑스1...에 대한 엑스와이

충분한 IID 추첨 (및 특정 규칙 조건이 충족 됨)으로 경험적 CDF는 인구의 기본 CDF에 수렴합니다.


12

경험적 CDF와 CDF간에 차이가 있습니까?

예, 다릅니다. 경험적 cdf는 적절한 cdf이지만, 이산 적 분포에서 도출되지 않은 경우에도 경험적 cdfs는 항상 이산 적이며, 분포의 cdf는 이산 이외의 다른 것이 될 수 있습니다.

표본을 마치 값의 모집단 인 것처럼 취급 할 경우, 각 표본은 똑같이 가능성이 높습니다 (즉, 각 관측치에 확률 1 / n 배치).이 분포의 cdf는 데이터의 ECDF가됩니다.

왜 그것을 경험적이라고합니까?

표본을 기준으로 한 모집단 cdf의 추정치입니다. 특히 각 개별 데이터 값에서 샘플의 비율을 처리하고 모집단 확률 인 것처럼 처리하면 ECDF를 얻게됩니다.

경험적은 "이론보다는 관찰에 의한 것"과 같은 의미를 가지고 있으며,이 경우에 정확히 의미합니다. 관측 값을 사용하여 분포 함수를 결정합니다.


10

경험적 CDF는 실제 데이터 세트로 구성됩니다 (아래 그림에서 표준 정규 분포의 100 개 샘플을 사용했습니다). CDF는 이론적 인 구조입니다. 무한히 많은 샘플을 채취 할 수 있는지 알 수 있습니다.

경험적 CDF는 일반적으로 특히 큰 샘플의 경우 CDF와 상당히 유사합니다 (사실, 샘플 크기가 증가함에 따라 CDF에 얼마나 빨리 수렴되는지에 대한 이론이 있습니다).

경험적 CDF 대 CDF


10

경험적은 데이터와 관찰에서 구축 한 것입니다. 예를 들어, 한 국가의 사람들의 키 분포에 대해 알고 싶다고 가정하십시오. 사람을 측정하는 것으로 시작하여 분포에 근사 할 수있는 히스토그램을 생각해냅니다. 그런 다음 경험적 CDF를 계산합니다.

통계 분포 (동일한 매개 변수로 동일한 결과를 제공하는 결정적 공식)를 사용하는 경우 CDF도 계산할 수 있습니다.

"이 나라 사람들의 키는 평균 1.75m, 표준 편차 0.1m 인 정규 분포와 비슷하게 분포되어 있습니다. 그런 다음 CDF ~ 경험적 분포의 구성된 CDF 대신 .(μ=1.75 미디엄,σ=0.1 미디엄)


CDF와 Emperical CDF가 전 세계의 모든 실험 샘플링의 한계에서 동일한 모집단을 설명 할 가능성을 나타내는 신뢰도 측정이 있습니까? 예를 들어 선거 선거에 적용되는 것 같습니다. (아직 출력이 함수로 설명 될 수 없기 때문에 아닐 수도 있지만 ...)
BenPen

3

Dictionary.com 에 따르면 "임시"의 정의는 다음과 같습니다.

경험 또는 실험에 의해 유도되거나 유도됩니다.

따라서 경험적 CDF는 데이터에서 얻는 CDF입니다. 이는 이론적 CDF (일반적으로 "CDF"라고 함)와 대조되며, 이는 정규 분포와 같은 통계 또는 확률 모델에서 얻습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.