James-Stein Estimator : Efron과 Morris 는 야구 예제에서 수축률에서


18

브래들리 에프론 (Bradley Efron)과 칼 모리스 (Carl Morris)1977 Scientific American 논문에서 "Stein 's Paradox in Statistics"의 James-Stein Shrinkage factor 계산에 대한 질문이 있습니다 .

나는 야구 선수에 대한 데이터를 수집했고 아래에 주어진다 :

Name, avg45, avgSeason    
Clemente, 0.400, 0.346    
Robinson, 0.378, 0.298    
Howard, 0.356, 0.276    
Johnstone, 0.333, 0.222    
Berry, 0.311, 0.273    
Spencer, 0.311, 0.270    
Kessinger, 0.289, 0.263    
Alvarado, 0.267, 0.210    
Santo, 0.244, 0.269    
Swoboda, 0.244, 0.230    
Unser, 0.222, 0.264    
Williams, 0.222, 0.256    
Scott, 0.222, 0.303    
Petrocelli, 0.222, 0.264    
Rodriguez, 0.222, 0.226    
Campaneris, 0.200, 0.285    
Munson, 0.178, 0.316    
Alvis, 0.156, 0.200

avg45박쥐에서 평균 세 이후의 평균 이며 기사에서 y 로 표시됩니다 . 시즌 평균의 끝입니다.45yavgSeason

z

z=y¯+c(yy¯)
c
c=1(k3)σ2(yy¯)2,

kk=18(yy¯)2avg45σ2c=0.212

나는 를 모두 사용해 보았습니다.σx2σy2σ2c=0.212

σ2


1
MAD ( en.wikipedia.org/wiki/Median_absolute_deviation )가 웨이블릿 축소에 많이 사용 된다는 것을 알고 있습니다.
로빈 지라드

답변:


19

σ245Yibinom(45,pi)pi^=Yi

p^inorm(mean=pi,var=pi(1pi)/45).

σ^2=p^(1p^)45,
p^
p^=11845i=11845Yi=Y¯.

다음 R 코드로이를 확인할 수 있습니다. 데이터는 다음과 같습니다.

y <- c(0.4, 0.378, 0.356, 0.333, 0.311, 0.311, 0.289, 0.267, 0.244, 0.244, 0.222, 0.222, 0.222, 0.222, 0.222, 0.2, 0.178, 0.156)

σ2

s2 <- mean(y)*(1 - mean(y))/45

σ^20.004332392

1 - 15*s2/(17*var(y))

c0.2123905k2k3 .


훌륭한 설명, 나는 이항의 정상적인 근사치를 좋아합니다.
체임벌린 폰차

14

나는 확실하지 않다 c=0.212

Efron, B., & Morris, C. (1975). Stein 추정기 및 일반화를 사용한 데이터 분석 미국 통계 협회 저널, 70 (350), 311-319 (pdf 링크)

또는 더 자세한

Efron, B., & Morris, C. (1974). Stein 추정기 및 일반화를 사용한 데이터 분석 R-1394-OEO, RAND Corporation, 1974 년 3 월 (pdf 링크) .

312 페이지에서 Efron & Morris는 이러한 데이터의 아크-싱 변환을 사용하여 타격 평균의 분산이 대략적으로 일치 함을 알 수 있습니다.

> dat <- read.table("data.txt", header=T, sep=",")
> yi  <- dat$avg45
> k   <- length(yi)
> yi  <- sqrt(45) * asin(2*yi-1)
> c   <- 1 - (k-3)*1 / sum((yi - mean(yi))^2)
> c
[1] 0.2091971

그런 다음 계산에 c = .209를 사용합니다.z 값 쉽게 역변환 할 수 있습니다.

> zi  <- mean(yi) + c * (yi - mean(yi))
> round((sin(zi/sqrt(45)) + 1)/2,3) ### back-transformation
[1] 0.290 0.286 0.282 0.277 0.273 0.273 0.268 0.264 0.259
[10] 0.259 0.254 0.254 0.254 0.254 0.254 0.249 0.244 0.239

이것이 Stein 추정기의 가치입니다. Clemente의 경우 .290을 얻었으며 이는 1977 년 기사의 .294와 매우 비슷합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.