균일 분포의 모수 추정 : 부적절한 사전?


10

우리는 N 개의 샘플을 가지고 있습니다. Xi균일 한 분포에서 [0,θ] 어디 θ알 수 없습니다. 견적θ 데이터에서.

베이 즈의 규칙은 ...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

가능성은 다음과 같습니다.

f(Xi|θ)=i=1N1θ (편집 : 언제 0Xiθ 모든 i, 그렇지 않으면 0-고마워 whuber)

하지만 다른 정보는 없습니다 θ이전의 비율이 1 (즉, 유니폼) 또는 1L (제프리스?) [0,]그러나 내 적분이 수렴하지 않고 진행 방법을 잘 모르겠습니다. 어떤 아이디어?


2
당신의 가능성은 잘못되었습니다 : 그것은 항상 0이 될 것입니다 θ 가장 큰 것보다 적다 Xi.
whuber

어떤 정수를 복용하고 있는지 보여줄 수 있습니까?

그래서, 나는 부적절한 선행을 다루는 방법을 모른다고 생각합니다. 예를 들어 쓰고 싶습니다f[Xi]=Θf(Xi|θ)f(θ)dθ

1
이전의 부적절한 경우 f[Xi]=Θf(Xi|θ)f(θ)dθ = max(Xi)θNdθ= 및 이전 대해 마찬가지로 얻습니다 거의 확실 하기 때문에 적분이 수렴 할 것입니다. max(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
whuber

1
Bernardo 참조 후부는 파레토이다- 비 정보적인 사전 카탈로그를 참조하십시오 .
Stéphane Laurent

답변:


4

이로 인해 몇 가지 흥미로운 논쟁이 벌어졌지만 실제로 관심사에 큰 영향을 미치지는 않습니다. 개인적으로 저는 가 scale 매개 변수 이기 때문에 변환 그룹 인수가 적절 하다고 생각합니다.θ

p(θ|I)=θ1log(UL)θ1L<θ<U

이 분포는 문제의 재조정시 동일한 형식을 갖습니다 (재조정시 "불변"가능성도 있습니다). 이 이전의 커널 은 함수 방정식 를 풀어서 도출 할 수 있습니다 . 값 은 문제에 따라 다르며 샘플 크기가 매우 작은 경우에만 중요합니다 (1 또는 2와 같이). 후부는 잘린 파레토입니다.f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
여기서 은 N 번째입니다 주문 통계 또는 표본의 최대 값. 우리의 후방 평균 얻을 우리가 세트 및 우리가 간단한 exression를 얻을 .X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

하지만 지금 우리가 사용하는 가정보다 일반적인 이전에 의해 주어진 (주 우리는 제한 유지하는 것이 모든 것이 적절한 지 확인하지 않으려면 - 더 단수 수학을 다음 ). 후방은 상기와 동일하지만,로 에 의해 대체 - 단 . 위의 계산을 반복하여 우리는 단순화 된 사후 평균p(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

따라서 균일 한 이전 ( )은 (평균은 대해 무한대 인 경우 의 추정치를 제공합니다 . 이것은 여기서 토론 이 분산 추정에서 제수로 또는 을 사용할지 여부와 약간 비슷하다는 것을 보여줍니다 .c=1N1N2X(N)N2N=2NN1

이 경우, 종래 균일 부적절한 사용에 대해 하나 개의 인수 때 후방 부적절하다는 것이다 , 그대로 비례에 . 그러나 이것은 이거나 매우 작은 경우에만 중요합니다 .N=1θ1N=1


1

여기서의 목적은 아마도 유효하고 유용한 추정치를 얻는 때문에, 사전 분포 표본이 나오는 모집단 분포의 사양과 일치해야합니다 . 이것은 샘플 자체를 사용하여 사전을 "계산"한다는 의미는 아닙니다. 이는 전체 절차의 유효성을 무효화합니다. 표본이 나오는 모집단은 각각 범위의 iid 균일 랜덤 변수의 집단이라는 것을 알고 있습니다. 이것은 유지되는 가정 이며 우리가 보유한 이전 정보의 일부입니다 ( 샘플 과는 아무런 관련이 없습니다 . 즉, 임의 변수의 하위 집합을 구체적으로 구현하는 것과 관련 이 없습니다 ).θ[0,θ]

이제이 모집단은 랜덤 변수 로 구성되어 있다고 가정합니다 (샘플은 랜덤 변수 구현으로 ). 유지 된 가정은 mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

소형화 냅니다. 그런 다음 를 쓸 수 있으며 이라고 쓸 수도 있습니다. maxi=1,...,n{Xi}XθX

θ=cXc1

의 밀도 함수 의 균일 RV의 범위를 IID 이다 maxN[0,θ]

fX(x)=N(x)N1θN

지원 하고 다른 곳에서는 0입니다. 그런 다음 하고 변수 변경 공식을 적용하여 유지 가정과 일치하는 대한 사전 분포를 얻습니다 . [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

상수 적절하게 지정하지 않으면 적절 하지 않을 수 있습니다 . 그러나 우리의 관심은 대한 적절한 후손 을 갖는 것입니다. 또한 우리는 의 가능한 값을 제한하고 싶지 않습니다 (유지 된 가정에 의해 암시 된 제한을 넘어서). 우리가 떠날 그래서 미결정. 이어서 기록 후방이고cθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

정규화 상수 A의 경우

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

후방

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

이전 분포 의 결정되지 않은 상수 는 편리하게 상쇄되었다는 점에 유의하십시오 .c

후자는 의 값에 관해 특정 샘플이 우리에게 줄 수있는 모든 정보를 요약합니다 . 대한 특정 값을 얻으려면 사후의 예상 값을 쉽게 계산할 수 있습니다. θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

이 결과에 직관이 있습니까? 음의 수가 의 증가는 더 많은 가능성이 그 (것)들의 사이에서 최대의 실현은 점점 더 가까이 자신의 상한에있을 것입니다 의 사후 평균 값이 정확히 무엇 인 - 있는 경우, 말 : 반영 , 하지만, 만약 . 이것은 이전의 선택에 관한 우리의 전술이 합리적 이고 당면한 문제 와 일치 하지만 어떤 의미에서는 반드시 "최적의"것은 아니라는 것을 보여줍니다 .XθθN=2E(θX)=2xN=10E(θX)=109x


1
이전의 데이터를 바탕으로 비린내가 들립니다. 이 접근법을 어떻게 정당화합니까?
whuber

2
나는 당신의 이전이 "최고"가 아니라는 사실에 반대하는 것이 없습니다. 내가 어디 그런 말을 했습니까? 나는 당신의 접근 방식을 이해하려고 노력하고 있습니다. 나는이 평등을 아직 이해하지 못한다. 가 동등 에서 일정 하다면 , 그것은 와 가 모두 무작위가 아님을 의미합니까? 그런데 당신은 이전의 파생물에서 이라는 사실을 사용 하지 않습니까? (cc @whuber)cθ=cXXθc1
Stéphane Laurent

1
그리고 이전의 지원은 데이터에 달려 있습니까? ( )θ[x,[
Stéphane Laurent

3
데이터에 대한 사전 의존성 (지원을 통해서만하더라도)이 잘못 들립니다 . 샘플이 생성되기 전에 샘플의 최대 값을 알 수 없습니다 . 또한 는 와 가 모두 랜덤이므로 상관 관계가 거의 확실 하다고 주장합니다 . 그러나 이것은 의 사후 분포 ( 샘플에 주어진 의 조건부 분포 )가 의 Dirac 질량임을 의미합니다 . 그리고 이것은 사후 분포의 도출과 모순됩니다. (어떤 문자가 남아 있지 ...)θ=cXθX1θθcx
스테판 로랑

1
의 사후 분포는 에서 Dirac 입니다. 입니다. 베이 즈 정리는 원인이 아닙니다. 을 가정하여 모든 것을 파괴 합니다. 이것은 를 의미하므로 가 주어진 의 조건부 분포는 의 Dirac 질량 이고 원래의 가정은이 분포가 . θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
Stéphane Laurent

0

균일 한 사전 분포 정리 (간격 사건) :

" 데이터 외부의 에 대한 귀하의 정보 전체가 단일 제안 그러면 논리적으로 내부적으로 일관된 유일한 사전 지정 사양은 θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

따라서 위의 정리를 진정으로 믿는다면 이전의 사양은 Jeffrey의 이전과 일치해야합니다. "

통일 선 분포 정리의 일부가 아님 :

또는 이전 분포 를 파레토 분포 (파레토 분포 로 지정할 수 있습니다 . 파레토 분포는 균일에 대한 켤레 분포이며, 후방 분포는 접합에 의해 또 다른 균일 한 분포 여야한다는 것을 알고 있습니다. 그러나 파레토 분포를 사용하는 경우 일종의 방식으로 파레토 분포의 모수를 지정해야합니다.f(θ)


4
먼저 "논리적으로 내부적으로 가능한 유일한"대답은 균일 한 분포라고 말하고 대안을 제안합니다. 그것은 비논리적이고 나에게 일관성이 없다. :-).
whuber

2
동의 할 수 없습니다. 예를 들어, 는 의 PDF 인 에 대한 . 그러나 "정리"에 따르면 그 간격에서 pdf가 인 입니다 . 간단히 말해서, 제안 은 문제가 어떻게 매개 변수화되는지에 의존하지 않지만, "정리"의 결론은 매개 변수화에 의존하지만, 모호한 경우에는 매개 변수화에 의존합니다. B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
whuber

2
BabakP : 어떻게 이것이 정리 라고 말할 수 있을까요? 정리는 수학적 증거를 가진 수학적 주장입니다. 이 "정리"는 "원칙"으로 더 적절하게 지칭 될 것이지만, @whuber에 의해 나타난 바와 같이 모순되기 때문에 합리적이지 않다.
Stéphane Laurent

2
참조 BabakP에 감사드립니다. "증거 스케치"가 가짜임을 지적하고 싶습니다. Draper는 간격을 일정한 수의 동일한 간격 값으로 나누고 "한계를 통과합니다". 누구나 간격을 원하는 밀도로 근사하고 한계에 도달하도록 간격을 두어 값으로 나눌 수 있으며, 임의의 "논리적으로 내부적으로 일관성있는 사전 사양 만 가능"합니다. 이런 종류의 것들, 즉 비 베이지 인들이 비논리적이라는 것을 보여주기 위해 나쁜 수학을 사용하는 것은 베이지안 분석에 (불필요하게) 나쁜 이름을 준다. (cc @ Stéphane.)
whuber

1
@ Stéphane 저의 무감각을 용서해주세요 ( 불감증 )-여기서 제 2 언어로 대화하는 기술에 감탄하며, 모호한 용어를 의도적으로 사용하지 않습니다! Bogus 는 200 년 된 미국 속어에서 비롯된 돈을 위조하는 기계를 말하는 형용사입니다. 이 경우 그것은 이론을 위조하기위한 수학적 기계입니다 :-).
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.