비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까?


19

비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까?

부트 스트랩 방법이 여기에서 일반적으로 사용된다는 것을 알고 있지만 다른 옵션을 사용할 수 있습니다. 비모수 적 옵션을 찾고있는 동안 누군가 파라 메트릭 솔루션이 유효하다고 확신 할 수 있다면 좋을 것입니다. 샘플 크기는> 400입니다.

누구나 R로 샘플을 줄 수 있다면 대단히 감사하겠습니다.


3
>400

답변:


18

우선, 평균이 당면한 작업에 적합한 색인인지 확인합니다. 비대칭 분포의 "전형적 또는 중심적 가치"를 찾고 있다면 평균이 다소 비 대표적 가치를 가리킬 수 있습니다. 로그 정규 분포를 고려하십시오.

x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")

로그 정규 분포에 대한 평균 (빨간색), 20 % 트림 평균 (녹색) 및 중앙값 (파란색)

평균 (빨간색 선)은 대부분의 데이터에서 멀리 떨어져 있습니다. 20 % 트림 평균 (녹색) 및 중앙값 (파란색)이 "일반"값에 더 가깝습니다.

결과는 "비정규"분포의 유형에 따라 다릅니다 (실제 데이터의 히스토그램이 도움이 됨). 기울어지지 않았지만 꼬리가 짙 으면 CI가 매우 넓습니다.

어쨌든 부트 스트래핑은 비대칭 CI를 제공 할 수 있기 때문에 실제로 좋은 접근 방법이라고 생각합니다. R패키지는 simpleboot좋은 시작이다 :

library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))

... 다음과 같은 결과를 제공합니다.

# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals : 
Level     Percentile            BCa          
95%   ( 1.062,  1.228 )   ( 1.065,  1.229 )  
Calculations and Intervals on Original Scale

자세한 답변에 감사드립니다. 백분위 수와 조정 백분위 수 (BCa) 통계의 (최소) 차이에 대해 언급하고 싶습니까?
fmark

"부트 스트랩 바이어스 보정 가속 (BCa) 간격은 백분위 수를 편향 및 왜도에 맞게 수정하는 백분위 수 방법의 수정입니다"(Hesterberg, T., Monaghan, S., Moore, D., Clipson, A., & Epstein, R. (2005). 부트 스트랩 방법 및 순열 테스트. 통계 실습 소개, 14.1–14.70.). 소프트웨어가 허용 할 때마다 BCa 수정 CI를 사용하십시오 (참고 : 1000 개 이상의 재 샘플 필요)
Felix S

트리밍에 대한 인수가 더 이상 지원되지 않는 것으로 simpleboot 패키지 의 문서 에서 보입니다 . :(
et

8

κ^/(6에스2)κ^영형(1/2)영형(1)1/2>20>400

(특급(1)+2)특급(1)1kappa = (exp(1)+2)*sqrt( exp(1) - 1) = 6.184877s = sqrt( (exp(1)-1)*exp(1) ) = 2.1611972*s*qnorm(0.975)/sqrt(n) = 0.2678999kappa*s/(6*n) = 0.00222779kappa


2

다음을 계산하여 로그 정규 분포를 시도하십시오.

  1. 데이터의 로그;
  2. (1)의 평균 및 표준 편차
  3. (2)에 해당하는 신뢰 구간
  4. (3)의 지수

예상 값에 대한 비대칭 신뢰 구간 (원시 데이터의 평균이 아님)으로 끝납니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.