기대 값이 산술 평균과 같은 이유는 무엇입니까?


47

오늘 저는 수학 기대라는 새로운 주제를 발견했습니다. 내가 따르는 책은 기대는 확률 분포에서 나오는 랜덤 변수의 산술 평균이라고 말합니다. 그러나 일부 데이터의 곱과 확률의 합으로 기대 값을 정의합니다. 이 두 가지 (평균과 기대)는 어떻게 동일 할 수 있습니까? 데이터와 확률 분포의 합이 전체 분포의 평균 일 수있는 방법은 무엇입니까?

답변:


51

비공식적으로 확률 분포는 랜덤 ​​변수의 결과에 대한 상대 빈도를 정의합니다. 예상 값은 해당 결과에 대한 가중 평균으로 간주 될 수 있습니다 (상대 빈도에 의해 가중 됨). 마찬가지로, 예상 값은 발생 확률과 정확히 비례하여 생성 된 숫자 집합의 산술 평균으로 생각할 수 있습니다 (연속 랜덤 변수의 경우 특정 값의 확률이 이므로 정확하게 적용 되지 않습니다 ).0

예상 값과 산술 평균 간의 연결은 불연속 랜덤 변수를 사용하여 가장 명확합니다.

E(X)=SxP(X=x)

여기서 는 샘플 공간입니다. 예를 들어, 다음 과 같은 불연속 랜덤 변수 가 있다고 가정하십시오 .XSX

X={1with probability 1/82with probability 3/83with probability 1/2

즉, 확률 질량 함수는 , , 입니다. 위의 공식을 사용하면 예상 값은P ( X = 2 ) = 3 / 8 P ( X = 3 ) = 1 / 2P(X=1)=1/8P(X=2)=3/8P(X=3)=1/2

E(X)=1(1/8)+2(3/8)+3(1/2)=2.375

이제 확률 질량 함수에 정확히 비례하는 빈도로 생성 된 숫자를 고려하십시오 (예 : 숫자 집합 -2 초, 6 초 및 8 초. 이제이 숫자의 산술 평균을 취하십시오.{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123

1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375

예상 값과 정확히 같은지 확인할 수 있습니다.


더 간단한 {1,2,2,2,3,3,3,3} 세트를 사용하면 더 잘 설명되지 않습니까? 해당 집합의 산술 평균을 나타내는 식은 해당 변수의 예상 값을 나타내는 식과 동일합니다 (가중 곱을 단순 합으로 변환하는 경우).
Dancrumb 2016 년

Re : "그 세트의 산술 평균을 나타내는 표현식은 해당 변수의 기대 값을 나타내는 표현식과 동일합니다 (가중 제품을 단순 합계로 변환하는 경우)"-예 @ Dancrumb, 즉 전체 요점 :)
Macro

12

기대 값은 확률 분포가 아닌 랜덤 변수의 평균값 또는 평균입니다. 따라서 불연속 랜덤 변수의 경우 가중치가 해당 개별 값의 상대적 발생 빈도에 따른 경우 랜덤 변수가 취하는 값의 가중 평균입니다. 절대적으로 연속적인 랜덤 변수의 경우 값 x에 확률 밀도를 곱한 값입니다. 관찰 된 데이터는 독립적으로 동일하게 분포 된 랜덤 변수 모음의 값으로 볼 수 있습니다. 표본 평균 (또는 표본 기대)은 관측 된 데이터에 대한 경험적 분포에 대한 데이터의 기대로 정의됩니다. 이것은 단순히 데이터의 산술 평균을 만듭니다.


2
+1. 좋은 캐치 다시 : "예상은 확률 분포가 아닌 랜덤 변수의 평균값 또는 평균입니다". 나는이 미묘한 용어의 오용을 보지 못했다.
Macro

4

정의에주의를 기울이자 :

평균은 숫자 모음의 합계를 모음의 숫자로 나눈 값으로 정의됩니다. 계산은 "1에서 n까지의 i (x sub i의 합)를 n으로 나눈 값"입니다.

기대 값 (EV)은 그것이 나타내는 실험의 반복 평균 장기 값입니다. 계산은 "1에서 n까지의 i의 경우, 이벤트 x sub i의 합에 확률을 곱한 것입니다 (그리고 모든 p sub i의 합은 1이어야 함)."

공정한 주사위의 경우 평균과 EV가 동일하다는 것을 쉽게 알 수 있습니다. 평균-(1 + 2 + 3 + 4 + 5 + 6) / 6-3.5이고 EV는 다음과 같습니다.

프로브 xp * x

0.167 1 0.17

0.167 2 0.33

0.167 3 0.50

0.167 4 0.67

0.167 5 0.83

0.167 6 1.00

EV = 합 (p * x) = 3.50

그러나 주사위가 "공정하지 않다"면 어떨까요 불공정 한 다이를 만드는 쉬운 방법은 4면, 5면 및 6면의 교차점에서 구석에 구멍을 뚫는 것입니다. 또한 새롭게 개선 된 비뚤어진 다이에서 4, 5 또는 6을 굴릴 확률은 이제 .2이고 1, 2 또는 3을 굴릴 확률은 이제 .133이라고 가정하겠습니다. 6 개의면을 가진 동일한 주사위이며, 각면마다 하나의 숫자이며이 주사위의 평균은 여전히 ​​3.5입니다. 그러나이 주사위를 여러 번 굴린 후에는 이벤트의 확률이 더 이상 모든 이벤트에서 동일하지 않기 때문에 EV가 3.8입니다.

프로브 xp * x

0.133 1 0.13

0.133 2 0.27

0.133 3 0.40

0.200 4 0.80

0.200 5 1.00

0.200 6 1.20

EV = 합 (p * x) = 3.80

다시 말하지만, 한 가지가 항상 다른 것과 "동일"하다는 결론을 내리기 전에 조심하고 정의로 돌아가 봅시다. 일반 다이가 어떻게 설정되어 있는지 확인하고 다른 7 개의 구석에 구멍을 뚫고 EV가 어떻게 변하는 지 확인하십시오.

Bob_T


-1

"평균"과 "예상 값"의 유일한 차이점은 평균이 주로 주파수 분포에 사용되고 기대 값이 확률 분포에 사용된다는 것입니다. 주파수 분포에서 샘플 공간은 변수와 발생 빈도로 구성됩니다. 확률 분포에서 표본 공간은 랜덤 변수와 확률로 구성됩니다. 이제 샘플 공간에서 모든 변수의 총 확률은 1이어야합니다. 여기에 기본적인 차이점이 있습니다. 기대 분모 항은 항상 = 1입니다. (즉, 요약 f (xi) = 1) 그러나 주파수 합계 (기본적으로 총 항목 수)에 대한 제한은 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.