표본 평균을 고려한 표본 중앙값의 예상 값


16

하자 평균을 나타내며하자 크기의 임의의 샘플의 평균을 나타내며 인 분포 . 는 어떻게 계산할 수 있습니까?YX¯n=2k+1N(μ,σ2)E(Y|X¯=x¯)

직관적으로, 정규성 가정으로 인해 이며 실제로 정답 이라고 주장하는 것이 합리적 입니다. 그래도 엄격하게 보여줄 수 있습니까?E(Y|X¯=x¯)=x¯

저의 초기 생각은 일반적으로 알려진 결과 인 조건부 정규 분포를 사용하여이 문제에 접근하는 것이 었습니다. 문제는 예상 값과 결과적으로 중앙값의 분산을 모르기 때문에 차 통계량을 사용하여 계산해야한다는 것 입니다. 그러나 그것은 매우 복잡하며 절대적으로 필요하지 않으면 오히려 거기에 가지 않을 것입니다. k+1


2
나는 이것이 방금 stats.stackexchange.com/a/83887에 게시 한 일반화의 즉각적인 결과라고 생각합니다 . 잔차 의 분포는 xix¯대략 0 에 대해 대칭 이며, 중간 값이 대칭 분포를 가지므로 평균은 0입니다. 따라서 잔차가 아닌 중앙값 자체의 기대치는 , QED와 같습니다. 0+E(X¯ | X¯=x¯)=x¯
whuber

@whuber 죄송합니다, 잔차?
JohnK

나는 내 의견에 그것들을 정의했다 : 그것들은 각각의 xi 와 그들의 평균 의 차이점 입니다.
whuber

@ whuber 아니요 이해하지만 귀하의 다른 답변이 내 질문과 어떤 관련이 있으며 귀하가 사용한 기대치가 정확히 어떻게 작동하는지 이해하려고 노력하고 있습니다.
JohnK

2
@whuber 알았어, 그럼 날 고쳐줘 내가 틀렸다면, 이제 두 번째 항은 0이므로 중앙값은 ˉ x 주위에서 대칭 입니다. 따라서 기대 감소에 ˉ XE(Y|X¯)=E(X¯|X¯)+E(YX¯|X¯)x¯x¯
JohnK

답변:


7

하자 나타낸다 원래의 샘플 및 Z는 엔트리에 임의의 벡터 Z의 K = X K - ˉ X를 . 그런 다음 Z 는 정규 중심입니다 (그러나 완전 확률로 합계가 0이라는 사실에서 알 수 있듯이 항목은 독립적이지 않습니다). 선형 기능으로서 X , 벡터 ( Z는 , ˉ X는 ) 것을 표시하기 때문에, 그 공분산 행렬의 계산 접미사 정상 Z는 독립적 ˉ X .XZZk=XkX¯ZX(Z,X¯)ZX¯

선회 , 하나의 볼이 Y = ˉ X + T T가 의 중간 인 Z . 특히, TZ 에만 의존 하므로 Tˉ X 와 무관 하며 Z 의 분포 는 대칭이므로 T 는 중심이됩니다.YY=X¯+TTZTZTX¯ZT

마지막으로,

E(YX¯)=X¯+E(TX¯)=X¯+E(T)=X¯.

감사합니다. 거의 1 년 전에이 질문을 받았으며 누군가가 마침내이를 해결하게되어 매우 기쁩니다.
JohnK

7

표본 중앙값은 주문 통계량이며 비정규 분포를 가지므로 표본 중앙값과 표본 평균 (정규 분포가 있음)의 유한 유한 표본 분포는 이변 량 정규가 아닙니다. 근사치에 의지하여 다음과 같은 증상이 나타납니다 ( 여기에서 내 대답 참조 ).

n[(X¯nYn)(μv)]LN[(00),Σ]

Σ=(σ2E(|Xv|)[2f(v)]1E(|Xv|)[2f(v)]1[2f(v)]2)

여기서 은 표본 평균이고 μ 모집단 평균, Y n 은 표본 중앙값 및 v 모집단 중앙값, f ( ) 는 임의의 변수의 확률 밀도이고 σ 2 는 분산입니다. X¯nμYnvf()σ2

대략 큰 표본의 경우, 공동 분포는 이변 량 정규입니다.

E(YnX¯n=x¯)=v+ρσvσX¯(x¯μ)

여기서 는 상관 계수입니다.ρ

표본 평균과 표본 중앙값 (표준화 된 양이 아님)의 대략적인 대표 본 공동 분포가되도록 점근 분포를 조작하면

ρ=1nE(|Xv|)[2f(v)]11nσ[2f(v)]1=E(|Xv|)σ

So

E(YnX¯n=x¯)=v+E(|Xv|)σ[2f(v)]1σ(x¯μ)

We have that 2f(v)=2/σ2π due to the symmetry of the normal density so we arrive at

E(YnX¯n=x¯)=v+π2E(|Xμσ|)(x¯μ)

where we have used v=μ. Now the standardized variable is a standard normal, so its absolute value is a half-normal distribution with expected value equal to 2/π (since the underlying variance is unity). So

E(YnX¯n=x¯)=v+π22π(x¯μ)=v+x¯μ=x¯

2
As always, nice answer +1. However, since we have no information about the sample size, the asymptotic distribution might not hold. If there is no way to obtain the exact distribution though, I suppose I'll have to make do. Thank you very much.
JohnK

6

The answer is x¯.

Let x=(x1,x2,,xn) have a multivariate distribution F for which all the marginals are symmetric about a common value μ. (It does not matter whether they are independent or even are identically distributed.) Define x¯ to be the arithmetic mean of the xi, x¯=(x1+x2++xn)/n and write xx¯=(x1x¯,x2x¯,,xnx¯) for the vector of residuals. The symmetry assumption on F implies the distribution of xx¯ is symmetric about 0; that is, when ERn is any event,

PrF(xx¯E)=PrF(xx¯E).

Applying the generalized result at /stats//a/83887 shows that the median of xx¯ has a symmetric distribution about 0. Assuming its expectation exists (which is certainly the case when the marginal distributions of the xi are Normal), that expectation has to be 0 (because the symmetry implies it equals its own negative).

Now since subtracting the same value x¯ from each of a set of values does not change their order, Y (the median of the xi) equals x¯ plus the median of xx¯. Consequently its expectation conditional on x¯ equals the expectation of xx¯ conditional on x¯, plus E(x¯ | x¯). The latter obviously is x¯ whereas the former is 0 because the unconditional expectation is 0. Their sum is x¯, QED.


Thank you for posting it as a full answer. I now understand the essence of your argument but I might ping you if something is still unclear.
JohnK

5
JohnK, I need to alert you to be cautious. A counterexample to this argument has been brought to my attention. I have encouraged its originator to post it here for further discussion, but briefly it concerns a discrete bivariate distribution with symmetric marginals but asymmetric conditional marginals. Its existence points to a flawed deduction early in my argument. I currently hope that the argument might be rescued by imposing stronger conditions on the xi, but my attention is presently focused elsewhere and I might not get to think about this for awhile.
whuber

4
In the meantime I would encourage you to unaccept this answer. I would ordinarily delete any answer of mine known to be incorrect, but (as you might be able to tell) I like solutions based on first principles rather than detailed calculations, so I hope this argument can be rescued. I therefore intend to leave it open for criticism and improvement (and therefore made it CW); let the votes fall as they may.
whuber

Of course, thanks for letting me know. We will discuss it further when you have time. In the meantime I will settle for the asymptotic argument proposed by @Alecos Papadopoulos.
JohnK

6

This is simpler than the above answers make it. The sample mean is a complete and sufficient statistic (when the variance is known, but our results do not depend on the variance, hence will be valid also in the situation when the variance is unknown). Then the Rao-Blackwell together with the Lehmann-Scheffe theorems (see wikipedia ...) will imply that the conditional expectation of the median, given the arithmetic mean, is the unique minimum variance unbiased estimator of the expectation μ. But we know that is the arithmetic mean, hence the result follows.

We did also use that the median is an unbiased estimator, which follows from symmetry.


1
By symmetry E[Y]=μ, indeed. Then from these two theorems we know that E[Y|X¯] is the Unique Minimum Variance Unbiased Estimator for μ which we already know to be equal to X¯. This is a brilliant answer, thank you very much. I would have marked it as the correct one, had I not done that already for another answer.
JohnK
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.