최소 추정량 향상


9

내가 있다고 가정 추정 긍정적 인 매개 변수를 와 해당 추정량에 의해 생산 불편 추정치 , 즉 , 등입니다.nμ1,μ2,...,μnnμ1^,μ2^,...,μn^E[μ1^]=μ1E[μ2^]=μ2

견적을 사용하여 을 추정하고 . 순진한 추정량 은 min(μ1,μ2,...,μn)min(μ1^,μ2^,...,μn^)

E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)

또한 해당 추정량 의 공분산 행렬이 있다고 가정합니다 . 주어진 추정값과 공분산 행렬을 사용하여 편향되지 않은 (또는 덜 편향된) 최소값을 얻을 수 있습니까?Cov(μ1^,μ2^,...,μn^)=Σ


베이지안 MCMC 접근 방식을 사용 하시겠습니까? 아니면 폐쇄 형 공식이 필요하십니까?
Martin Modrák

그러나 간단한 샘플링 접근법은 괜찮습니까? (또한 베이지안 분석을 위해 사전이 엄격하게 필요하지는 않지만 또 다른 이야기입니다)
Martin Modrák

@ MartinModrák 나는 샘플링 접근법에 경험이 없습니다. 내가 베이지안을 할 경우 나는 보통 간단한 켤레를한다. 그러나 이것이 당신이가는 길이라고 생각하면 계속해서 배우겠습니다.
Cagdas Ozgenc

이 추정치에 대해 더 알고 있습니까? 당신은 표현을 알고 있습니까? 이러한 모수를 추정하는 데 사용 된 데이터의 분포를 알고 있습니까?
wij

@wij 필요한 경우 견적 자의 다른 순간을 추정하려고 할 수 있습니다. 추정량 분포에 대한 분석 표현이 없습니다. 솔루션은 데이터 자체의 분포에 의존해서는 안됩니다 (내 요구 사항으로).
Cagdas Ozgenc

답변:


4

편견없는 견적 도구의 존재에 대한 명확한 답변이 없습니다. 그러나 추정 오차의 관점에서 추정 하는 것은 일반적으로 본질적으로 어려운 문제입니다.min(μ1,,μn)

예를 들어 및 . 하자 대상 량 될 의 추정치이다 . "순진한"추정값을 사용하는 경우 여기서 이면 추정 오차는 일정합니다. (각 의 추정 오류 는 ). 물론, 만약Y1,,YNN(μ,σ2I)μ=(μ1,,μn)θ=miniμiθ^θθ^=mini(Y¯i)Yi¯=1Nj=1NYi,jL2

E[θ^θ]2σ2lognN
μiσ2Nμi은 서로 멀리 떨어져 있으며 는 매우 작 추정 오류는 으로 줄여야합니다 . 그러나 최악의 경우 순진한 추정기보다 가 더 효과적 일 것으로 추정되지 않습니다 . 당신은 정확하게 표시 할 수 여기서 은 샘플 기반으로 의 가능한 모든 하고 최상위는 가능한 모든 구성을 인수합니다 .σσ2Nθ
infθ^supμ1,,μnE[θ^θ]2σ2lognN
θY1,,YNμi

따라서, 순 추정기 상수 MINIMAX 최적까지이며, 그리고 더 나은 추정치 없다 이러한 의미에서이.θ


제공된 추가 정보가 전혀 도움이되지 않습니까? 어떤 추가 통계가 도움이 될 수 있습니까?
Cagdas Ozgenc

혼란스러운 점을 유감스럽게 생각합니다. 추가 정보 (공분산)가 도움이되지 않는다는 의미는 아닙니다. 나는 단지 몇몇 인구 평균의 추정이 사실상 어렵다는 것을 지적하고 싶었다. 공분산 정보가 도움이되어야합니다. 예를 들어, 보통의 경우 가능한 모든 쌍에 대해 완벽한 상관 관계가 있으면 랜덤 관측치가 다른 평균 + 공통 노이즈 항에서 나온다는 것을 의미합니다. 이 경우, 순진 추정기 (최소 샘플 수단)는 편향되지 않습니다.
신재혁

3

편집 : 다음은 요청 된 것과 다른 질문에 대한 답변입니다. 가 임의의 것으로 간주되지만 가 고정 된 것으로 간주 되면 작동하지 않습니다 . 이는 아마도 OP가 염두에 둔 것입니다. 가 고정되어 있으면 보다 더 나은 대답이 없습니다.μμμmin(μ^1,...,μ^n)


평균 및 공분산 추정값 만 고려하면 을 다변량 정규 분포의 단일 표본으로 취급 할 수 있습니다 . 최소값을 추정하는 간단한 방법은 에서 많은 수의 샘플을 추출하고 각 샘플의 최소값을 계산 한 다음 최소값의 평균을 취하는 것입니다.(μ1,...,μn)MVN(μ^,Σ)

위의 절차와 그 한계는 베이지안 용어로 이해할 수 있습니다 -MVN에 대한 Wikipedia 의 표기법을 사용 합니다. 가 추정값의 알려진 공분산이고 하나의 관측 값이있는 경우 관절 후부 분포는 여기서 및 은 이전 위치에서 발생합니다. ). 당신은 아마에 전과를 넣어 기꺼이 아니기 때문에 , 우리는 제한이 걸릴 수 있습니다 평평 이전과 후방이되고 결과ΣμMVN(μ^+mλ01+m,1n+mΣ)λ0mμMVN(λ0,m1Σμm0μMVN(μ^,Σ). 그러나 이전의 플랫을 고려할 때 의 요소가 많이 다르다고 가정합니다 (모든 실수가 똑같이 가능성이 높으면 유사한 값을 얻는 것이 거의 불가능합니다).μ

빠른 시뮬레이션 프로그램이 절차 약간 과대 평가로 추정 의 요소 많은 상이하고 과소 요소가 유사하다. 사전 지식이 없으면 이것이 올바른 행동이라고 주장 할 수 있습니다. 적어도 일부 사전 정보 (예 : )를 기꺼이 밝히려면 사용 사례에 따라 결과가 약간 더 잘 동작 할 수 있습니다.min(μ)μmin(μ)m=0.1

더 많은 구조를 기꺼이 생각한다면 multivariete normal보다 더 나은 분포를 선택할 수 있습니다. 또한 Stan 또는 다른 MCMC 샘플러 를 사용 하여 의 추정치를 처음 에 맞추는 것이 좋습니다. 이렇게하면 공분산 구조 (MVN이 제공 할 수있는 것보다 풍부 할 수 있음)를 포함하여 추정기 자체의 불확실성을 반영하는 샘플 세트를 얻을 수 있습니다. 다시 한 번 각 표본의 최소값을 계산하여 최소값보다 사후 분포를 구하고 점 추정값이 필요한 경우이 분포의 평균을 구할 수 있습니다.μ(μ1,...,μn)


N 개의 랜덤 변수의 최소값을 추정하려고하지 않습니다. N 개의 최소 매개 변수를 추정하려고합니다. 귀하의 제안은 대한 추정치 인 반면 대한 추정치가 필요합니다.E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)
Cagdas Ozgenc

나는 이론적 근거를 설명하기 위해 답변을 편집하려고 노력했지만 도움이되기를 바랍니다.
Martin Modrák

따라서이 샘플링 방법은 단순한 추정기와 비교하여 더 나은 결과를 산출합니다 . 이는 가 멀리 있을 때도 잘 작동합니다 그들이 가까이있을 때 떨어져서 과소 평가합니다. 유용하기 위해서는 가까이있을 때 작동해야합니다. min(μ1^,μ2^,...,μn^)μi
Cagdas Ozgenc

또한 모든 는 양수이므로 실제 줄의 음수 부분이 실제로 필요하지는 않습니다. μi
Cagdas Ozgenc

1
당신은 내가 그 표시를 무시하고 그 표시를 수용하는 간단한 방법을 보지 못하는 것이 맞습니다. 또한 제안한 추정기 는 가 무작위로 간주 될 때 더 잘 수행 되지만 fixed 경우 보다 나쁩니다 . 나는 이것을 구제 할 수 없다고 생각하고 최선의 방법이 무엇인지 확신 할 수 없다-나는 실제로 질문에 대답하지 않기 때문에 대답을 삭제하려고 노력하고 있지만, 그 대답에는 몇 가지 아이디어가 포함되어 있습니다. 누군가에게 유용 할 수 있습니다. μmin(μ^)μ
Martin Modrák
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.