기대 값과 가능한 값 (모드)


15

분포 의 예상 값은 f(x)평균입니다. 즉 가중 평균 값

E[x]=+xf(x)dx

가장 가능성이 높은 값은 가장 가능성있는 값인 모드입니다.

그러나 우리는 어떻게 든 E[x] 를 여러 번 볼 것으로 예상 합니까? 여기 에서 인용 :

결과 xi 가 똑같이 가능하지 않은 경우 단순 평균을 가중 평균으로 바꾸어야하며, 이는 일부 결과가 다른 결과보다 가능성이 높다는 사실을 고려합니다. 그러나 직관은 동일하게 유지됩니다. x 의 예상 값은 평균적으로 발생할 것으로 예상되는 값입니다x .

나는 "평균적으로 일어난다"는 것이 무엇을 의미하는지 이해할 수 없다. 이것은 의미에 대해, 많은 시간을 측정하여 E[x] 다른 값보다 더 많이 예상된다는 것을 의미 x하는가? 그러나 이것이 모드의 정의가 아닙니까?

그렇다면 진술을 해석하는 방법은 무엇입니까? 그리고 의 확률 적 의미는 무엇 E[x]입니까?


또한 혼란스러워하는 예를 보여주고 싶습니다. 분포를 연구하면서 모드χ 2 m o d e = ν - 2 이고 E [ χ 2 ] = ν 이며 여기서 ν 는 데이터의 자유도입니다.χ2χmode2=ν2E[χ2]=νν

대학에서 최소 데이터를 맞추기 위해 최소 제곱 법을 사용한 후 테스트를 수행 할 때 "일반적으로 일어나는 일"이기 때문에 χ 2ν 를 얻을 것으로 예상 된다고 들었습니다 .χ2χ2ν


이 모든 것을 잘못 이해했거나 예상 값이 어떻게 든 매우 가능성이 있습니까? ( 가장 가능성이 높은 값이 모드 일지라도 )


4
나는 이 질문에 대한 상자에 들어있는 은유 의 힘을 정말 좋아합니다 . 왜냐하면 단순하고 명확한 대답을 생성하기 때문입니다. 임의의 변수의 기대 값은 (티켓에 그려진) 값을 나눈 값의 합입니다. 티켓 수 그게 다야. 이 정의 (또는보다 정교한 수학적 동등 물)를 따르지 않는 진술은 단지 추론 적이며 일부 상황에서는 매우 잘못 될 수 있습니다.
whuber

답변:


18

정규 분포의 경우 평균, 즉 예상 값이 모드와 같습니다.

일반적으로 예상 값은 가장 높을뿐만 아니라 밀도가 높을뿐만 아니라 발생할 가능성이 없을 수도 있습니다. 예를 들어, 확률이 각각 0 또는 2 인 랜덤 변수 X를 고려하십시오. 그런 다음 EX = 1이지만 예상 값 1은 발생 확률이 0이고 0과 2는 모두 분포 모드입니다.

"x의 기대 값은 평균적으로 일어날 것으로 예상되는 것"이라는 인용문은 기술적으로 평범하지 않은 평신도의 언어입니다. 기대 값은 수학적 평균 인 확률에서 매우 특정한 의미를 갖습니다. 일반인의 언어에서는 예상 값 또는 "평균"이 일반적으로 발생할 것으로 예상되는 것일 수 있습니다. "평균"이 발생하는 수학적 평균으로 해석되면 조정될 수 있습니다.

기대하는 것은

조 평균


1
질문을 구걸한다 : 무엇으로 보장 중간에 대해 가능 ?
밝은 별

@TrevorAlexander가 말했듯이 모드는 보장하지 않습니다. 연속 분포 모드를 고려하십시오.
Tim

3
@Trevor Alexander 항상 가능한 중앙값이 있습니다 (양의 확률 또는 밀도). 그러나 모든 중앙값이 반드시 가능한 것은 아닙니다. 랜덤 변수 X의 중앙값은 점 대 m 인 P ( X m ) 1 / 2 . X가 각각 확률 1/4 인 1,2,3 또는 4와 같으면 구간 [2,3]의 모든 숫자는 X의 중앙값입니다.P(Xm)1/2P(Xm)1/2
Mark L. Stone

5

예상되는 가치는 아주 추상적 인 것이며 그것이 가장 가능성있는 결과라고 생각할 이유가 없습니다. 다른 사람들이 지적했듯이 임의의 변수를 쉽게 구성 할 수 있습니다

P(X=E(X))=0
X

기대 값에 대한 유일한 정당화와 우리가 "가장 자주 볼 것으로 예상되는 이유" 는 많은 수법칙입니다 .

있다면nXi

X1++XnnE(X)

무슨 뜻인가요? 당신이 확률로 동전을 던진다 고 상상해보십시오p>1211p0

E(X)=1p+0(1p)=p

이제 분명히 "p"는 발생하지 않습니다 (머리 또는 꼬리, 0 또는 1).

E(X)=p


나는 많은 수의 법칙이 기대되는 가치에 대한 유일한 정당화 라고 말하지 않을 것 입니다. 예를 들어, en.wikipedia.org/wiki/… 는 유틸리티 함수의 예상 값을 고려하기위한 정당화입니다 (증거를 연구하지는 않았지만 그것이 많은 수의 법칙에 기반을 둔다면 놀랍습니다).
Juho Kokkala

3

나는 "예상 가치"라는 용어를 좋아하지 않으며 확률을 가르 칠 때 그것을 사용하지 않았습니다. 제 생각에는 "산술 평균"이 더 좋습니다. 왜냐하면 6면 다이의 산술 평균은 3.5이지만 그러한 숫자는 발생하지 않기 때문입니다. 나는 원래 대학에있을 때이 개념에 대한 "예상 가치"라는 용어를 들었습니다. 많은 기술적 용어는 명백한 비 기술적 의미에 동의하지 않습니다. ( "또는"이 떠 오릅니다.)

분포는 둘 이상의 모드를 가질 수 있지만 산술 평균은 고유합니다. 모드, 평균 및 중앙값은 다르며 용도가 다릅니다.


1
"또는"에 좋은 하나. 그로 인해 우리는 몇 가지 대안 이론을 연구 한 선형 프로그래밍 과정을 생각하게되었습니다. 그것들은 "A는 참이거나 B는 참이지만 둘다는 아닙니다"의 형식이었습니다. A xor B로 표현하는 것이 훨씬 쉽습니다. 캐주얼 한 거리 대화에서 xor를 많이 사용하는 소리가 들리지 않습니다.
Mark L. Stone

2

차이점은 이산 분포를 사용하는 것이 가장 쉽습니다.

{1,2,2,2,10} 및 {1,2,2,2,3}과 같이 각 숫자가 똑같이 그려 질 수있는 두 개의 값 세트를 고려하십시오.

둘 다 동일한 모드 (2)를 갖지만 예상 값이 다릅니다. 예상 값은 큰 값에 추가 가중치를 부여하고 모드는 단순히 어떤 값이 자주 발생하는지 찾습니다. 따라서이 분포에서 여러 번 나온 경우 표본 평균은 예상 값에 가깝고 가장 일반적인 정수는 모드에 가깝습니다.

mode=argmaxf(x)xf(x)

통계를 학습 할 때 언어를 사용하여 여러 가지 중심 경향을 구별하는 것이 일반적인 문제입니다. 예를 들어, 중앙값은 평균과 같은 큰 값으로 왜곡되지 않는 또 다른 측정 값입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.