베타 분포 평균에 대한 신뢰 구간 계산


12

[0,1]의 지정된 등급에 대한 베타 분포를 고려하십시오. 평균을 계산 한 후 :

μ=αα+β

이 평균 주위에 신뢰 구간을 제공 할 수있는 방법이 있습니까?


1
지배적- 인구 평균을 정의했습니다 . 신뢰 구간은 해당 평균의 일부 추정치를 기반으로합니다. 어떤 샘플 통계를 사용하고 있습니까?
Glen_b-복지국 Monica

Glen_b-안녕하세요. [0,1] 간격으로 제품의 정규화 된 평가 세트를 사용하고 있습니다. 내가 찾고있는 것은 평균 (주어진 신뢰 수준에 대한) 주위의 간격을 추정하는 것입니다. 예 : mean +
-0.02

2
dominic : 다시 시도하겠습니다. 당신은 인구 평균을 모른다 . 추정값이 구간의 중간에 오게하려면 ( 설명에서와 같이 half-width 추정값) 중간에 간격을 두려면 중간에 해당 수량에 대한 추정기가 필요합니다. 그걸 위해 무엇을 사용하고 있습니까? 최대 가능성? 순간의 방법? 다른 것? ±
Glen_b-복지 주 모니카

Glen_b-양해 해 주셔서 감사합니다. 나는 MLE를 사용하려고합니다
지배적 인

2
지배적; 이 경우, 큰 경우 최대 우도 추정기의 점근 적 특성을 사용합니다. 의 ML 추정치는 평균 및 Fisher Information에서 계산할 수있는 표준 오류 와 함께 정규 정규 분포입니다 . 작은 샘플에서 때때로 MLE의 분포를 계산할 수 있습니다 (베타의 경우에는 어렵다는 것을 기억합니다). 대안은 샘플 크기에서의 분포를 시뮬레이션하여 그 동작을 이해하는 것입니다. μ μnμμ
Glen_b-복지 주 모니카

답변:


22

베타 분포의 매개 변수에 대한 신뢰 구간을 계산하는 특정 방법이 있지만 베타 분포를 포함하여 (거의) 모든 종류의 분포 에 사용할 수 있으며 R로 쉽게 구현할 수있는 몇 가지 일반적인 방법을 설명하겠습니다. .

프로파일 가능성 신뢰 구간

대응하는 프로파일 가능성 신뢰 구간을 사용하여 최대 가능성 추정으로 시작합시다. 먼저 샘플 데이터가 필요합니다.

# Sample size
n = 10

# Parameters of the beta distribution
alpha = 10
beta = 1.4

# Simulate some data
set.seed(1)
x = rbeta(n, alpha, beta)

# Note that the distribution is not symmetrical
curve(dbeta(x,alpha,beta))

베타 분포에 대한 확률 밀도 기능.

실제 / 이론적 평균은

> alpha/(alpha+beta)
0.877193

이제 베타 분포에서 표본에 대한 음의 로그 우도 함수를 계산하는 함수를 만들고 매개 변수 중 하나 인 평균을 만들어야합니다. 우리는 dbeta()함수 를 사용할 수 있지만, 이것은 평균과 관련된 매개 변수를 사용하지 않기 때문에 매개 변수 ( αβ )를 평균과 다른 변수 (표준 편차와 같은)의 함수 로 표현해야합니다 .

# Negative log likelihood for the beta distribution
nloglikbeta = function(mu, sig) {
  alpha = mu^2*(1-mu)/sig^2-mu
  beta = alpha*(1/mu-1)
  -sum(dbeta(x, alpha, beta, log=TRUE))
}

최대 가능성 추정치를 찾으려면 라이브러리 에서 mle()함수를 사용할 수 있습니다 stats4.

library(stats4)
est = mle(nloglikbeta, start=list(mu=mean(x), sig=sd(x)))

지금은 경고를 무시하십시오. 매개 변수에 유효하지 않은 값을 시도하여 α 및 / 또는 β에 음수 값을 제공하는 최적화 알고리즘으로 인해 발생합니다 . 경고를 피하기 위해 lower인수를 추가하고 method사용 된 최적화를 변경할 수 있습니다 .

이제 두 모수에 대한 추정치와 신뢰 구간이 있습니다.

> est
Call:
mle(minuslogl = nloglikbeta, start = list(mu = mean(x), sig = sd(x)))

Coefficients:
        mu        sig 
0.87304148 0.07129112

> confint(est)
Profiling...
         2.5 %    97.5 %
mu  0.81336555 0.9120350
sig 0.04679421 0.1276783

예상 한대로 신뢰 구간은 대칭 이 아닙니다 .

par(mfrow=c(1,2))
plot(profile(est)) # Profile likelihood plot

베타 분포에 대한 프로파일 가능성도.

두 번째 외부 자홍색 선은 95 % 신뢰 구간을 나타냅니다.

또한 단 10 개의 관측치로도 매우 좋은 추정치 (좁은 신뢰 구간)를 얻습니다.

의 대안으로 패키지 mle()fitdistr()기능을 사용할 수 있습니다 MASS. 이것도 최대 우도 추정값을 계산하며, 음의 로그 우도가 아닌 밀도 만 제공하면되지만 프로파일 우도 신뢰 구간은 제공하지 않으며 비대칭 (대칭) 신뢰 구간 만 제공한다는 장점이 있습니다.

더 나은 옵션은 mle2()(및 관련 함수) bbmle패키지에서보다 유연하고 강력하며 mle()약간 더 좋은 플롯을 제공하는 것입니다.

부트 스트랩 신뢰 구간

다른 옵션은 부트 스트랩을 사용하는 것입니다. R에서 사용하기가 매우 쉽고 밀도 함수를 제공 할 필요도 없습니다.

> library(simpleboot)
> x.boot = one.boot(x, mean, R=10^4)
> hist(x.boot)                # Looks good
> boot.ci(x.boot, type="bca") # Confidence interval
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 10000 bootstrap replicates

CALL : 
boot.ci(boot.out = x.boot, type = "bca")

Intervals : 
Level       BCa          
95%   ( 0.8246,  0.9132 )  
Calculations and Intervals on Original Scale

부트 스트랩은 데이터가 베타 배포에서 나오지 않아도 작동한다는 이점이 있습니다.

점근 적 신뢰 구간

평균에 대한 신뢰 구간의 경우 중심 한계 정리 (및 t- 분포)를 기반으로 한 오래된 점근 적 신뢰 구간을 잊지 마십시오 . 표본 크기가 크거나 (CLT가 적용되고 표본 평균의 분포가 거의 정상 임) αβ 모두의 값이 크면 (베타 분포 자체가 대략 정상 임) 잘 작동합니다. 여기에는 둘 다 없지만 신뢰 구간은 여전히 ​​나쁘지 않습니다.

> t.test(x)$conf.int
[1] 0.8190565 0.9268349

n 값이 약간 큰 경우 (두 매개 변수의 값이 너무 크지 않은 경우) 점근 적 신뢰 구간이 매우 잘 작동합니다.


고마워 칼. 빠른 질문 : 알파와 베타를 어떻게 결정 했습니까? 나는 분산과 표본 평균을 사용하여 알파와 베타를 얻었지만 표본 평균과 모집단 평균을 혼동했을 수 있으므로 올바른 방법으로 확신하지 못합니다 ... 위 Glen_b의 의견 참조 .
지배적 인

평균 및 표준 편차의 함수로 αβ 를 결정하기 위해 평균 및 표준 편차에 대한 함수를 αβ 의 함수로 반전했습니다 (그러나 그물에서 찾아 볼 수도 있습니다).
Karl Ove Hufthammer

칼 +1 , 베타 분포의 평균 및 분산을 감안할 때 비슷한 질문 이 있습니다. 평균의 신뢰 구간을 추정하는 방법이 있습니까? 예를 들어 정규 배포에서는 쉽게 할 수 있지만이 베타 배포를 어떻게 수행 할 수 있는지 모르겠습니다. 질문을 제기 했지만 중복으로 표시되었습니다. α,β
예측 자

0

베타 회귀를 확인하십시오. R 을 사용하여 수행하는 방법에 대한 좋은 소개 는 여기에서 찾을 수 있습니다.

http://cran.r-project.org/web/packages/betareg/vignettes/betareg.pdf

신뢰 구간을 구성하는 또 다른 (정말 쉬운) 방법은 비모수 적 부 스트랩 접근 방식을 사용하는 것입니다. Wikipedia에 좋은 정보가 있습니다.

http://en.wikipedia.org/wiki/Bootstrapping_%28statistics%29

또한 여기에 좋은 비디오 :

http://www.youtube.com/watch?v=ZCXg64l9R_4

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.