표본 크기 1에서 모집단 평균에 대해 무엇을 말할 수 있습니까?


43

아무튼 나는 인구 평균에 대해, 우리가 말할 수있는 궁금, 내가 가진 모두가 하나 개의 측정이다 (1 샘플 크기). 분명히, 우리는 더 많은 측정을 원하지만, 얻을 수는 없습니다.y 1μy1

이는 표본 평균 때문에, 저 보인다 , 사소하다 동일 그리고, . 그러나 표본 크기가 1이면 표본 분산이 정의되지 않으므로 의 추정값으로 를 사용하는 것에 대한 신뢰도 정의되지 않습니다. 맞습니까? 의 추정치를 전혀 제한 할 수있는 방법이 있습니까? y1E[ ˉ y ]=E[y1]=μ ˉ y μμy¯y1E[y¯]=E[y1]=μy¯μμ


예, 의 신뢰 구간은 특정 가정하에 구성 될 수 있습니다. 아무도 게시하지 않으면 추적합니다. μ
soakley

5
참조 stats.stackexchange.com/questions/1807을 동일한 질문의 또 다른 버전 (샘플의 평균을 사용할 수 있지만 그 샘플 크기 때문에 효과적으로 평균은이다 단일 및 미지의 샘플링 분포 관찰) stats.stackexchange 관련 토론은 .com / questions / 20300 을 참조하십시오.
whuber

일반적인 경우에 이러한 추정기의 최적 성을 논의하는 최근 기사 : tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

답변:


8

다음은 Poisson 사례에 대한이 질문에 대한 새로운 기사로, 훌륭한 교육 학적 접근 방식을 취합니다.

안데르손 괴 스타 당 (2015). 하나의 관찰을 사용하여 포아송 평균의 대략적인 신뢰 구간을 구축하기위한 교실 접근. 미국 통계 학자 , 69 (3), 160-164, DOI : 10.1080 / 00031305.2015.1056830 .


불행히도 페이 월 뒤에서.

@Tim : 그렇습니다. 그런 다음 ASA 멤버쉽 은 엄청나게 비싸지 않으며 미국 통계 학자 , JASA 및 기타 다른 저널에 매우 합리적인 가격으로 액세스 할 수 있습니다. 개인적으로 내 주머니에서 아주 행복하게 지불합니다. 난 당신이 여기에 돈의 가치를 얻을 생각합니다. 물론 YMMV.
S. 콜라 사-Monica Monica

4
+1이지만 분산이 평균과 같아야하므로 포아송 사례는 일반 사례와 근본적으로 다릅니다. 푸 아송 결과는 매우 간단하지만정상적인 경우의 결과는 반 직관적이고 신비합니다. x±9.68|x|
amoeba는 Reinstate Monica가

@amoeba : 매우 정확하지만 OP는 배포에 대한 제한을 지정하지 않았습니다.
S. Kolassa-복원 모니카

이것은 주석으로 사용하기에 너무 짧습니다. 그러나 그것이 대답으로 받아 들여 졌기 때문에 아마도 주석으로 변환하고 싶지 않을 것입니다. 그렇다면 기사의 요점을 요약 해 주시겠습니까?
Richard Hardy

42

모집단이 정규 인 것으로 알려진 경우 단일 관측치 기준으로 95 % 신뢰 구간 이x

x±9.68|x|

이에 대해서는 Wall, Boen, Tweedie, The American Statistician , 2001 년 5 월, Vol. 55, No.2 . ( pdf )


5
나는 바보 소리를 싫어하지만 .... 확실히하지 않습니다. 이것은 (... 제대로 I 평균 스칼라 곱셈) 단위에 따라 모두에서 제대로 작동하지 않습니다
알렉 청록에게

8
@Alec 절차가 측정 단위 (즉, 변하지 않음)에 의존한다고해서 자동으로 무효화되거나 심지어 불량하다는 의미는 아닙니다. 이것은 유효합니다 : 기사를 읽고 수학하십시오. 그러나 많은 사람들은 그것이 조금 혼란 스럽다고 인정할 것입니다 . 더 놀랍게도, 기본 분포가 정규라고 가정 할 필요조차 없습니다. 단봉 분포에 대해 비슷한 결과가 유지됩니다 (그러나 9.68은 약 19 정도 증가해야 함). 질문.
whuber

4
이 저널의 이후 호는 편집자에게 세 통의 편지를 썼는데, 그 중 하나는 Alec Teal의 단원에 대한 요점을 제기했습니다. Wall의 답변은 "신뢰 구간은 등변하지 않습니다 (즉, 적용 확률은 ...에 따라 다릅니다 "). "신뢰 구간은 중추적 인 수량을 기준으로하지 않습니다 ..."라고 말합니다. |μ|σ
soakley

5
그냥 너희들에게 약간의 작업 저장하려면 : 편집자에게 편지를 & 답변 등장 @soakley 노트 미국의 통계 학자를 , 권. 56 번 1 (2002) .
S. Kolassa-복원 Monica Monica

3
이에 대해 확률로 평균을 포함 신뢰 구간을 줄 것으로 보인다 때 이지만 그렇지 않으면 확률이 훨씬 높습니다. 경우 다음 명확 확률은 신뢰 구간 등을 항상 포함 . 95%σ|μ|>0μ=0100%0
Henry

28

물론입니다. 베이지안 패러다임을 사용하십시오 . 기회는 당신이 적어도이있는 일부 무엇을 생각 예를 들어, 물리적으로 음수가 될 수없는, 또는 분명보다 큰 100 (어쩌면 당신은 지역 고등학교 축구 팀 구성원의 높이를 측정하는이 될 수 없다 - 아마도 수를 피트). 그에 앞서, 당신의 고독한 관찰로 그것을 업데이트하고, 당신은 멋진 후부를 가지고 있습니다.μ


18
(+1) 하나의 관찰은 이전에 압도 될 것이기 때문에, 당신이 후부에서 나가는 것이 이전에 넣은 것보다 훨씬 많지 않을 것입니다.
whuber

우리가 그러한 비참함을 암묵적으로 가능성과 결합한 경우 어떻게해야할까요? ? x±9.68|x|
Simon Kuang 2016 년

@SimonKuang : 하나의 개념적 문제는 만 사용할 수 있다는 것입니다. 관찰 한 후 interval 이므로 이전에 들어갈 수 없습니다 . x±9.68|x|x
S. Kolassa-복원 Monica Monica

@StephanKolassa 아니요,이 구간 (및 관련 분포)은 가능성을 형성합니다. 우리의 사전은 별개입니다.
Simon Kuang

@SimonKuang : 그렇습니다. 제 실수입니다. 불행히도, 현재로서는이 일을 할 시간이 없지만,이 작업을 수행하는 경우 찾은 내용을 게시하십시오!
S. Kolassa-복원 모니카

14

@soakley의 답변이 효과가 있는지 설명하기위한 작은 시뮬레이션 연습 :

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

100 만 건의 무작위 시행 중 신뢰 구간에는 실제 평균 백만 회, 즉 항상 . 신뢰 구간이 95 % 신뢰 구간 인 경우에는 발생하지 않아야 합니다.

수식이 작동하지 않는 것 같습니다 ... 또는 코딩 실수를 한 적이 있습니까?

편집 : 사용시 동일한 경험적 결과가 유지됩니다 . 그러나이다 대 따라서 매우 가까운 95 % 신뢰 구간에 -.(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
실제로, 가 0이 아닌 경우, 이것은 유용하다 (그리고 처음에 코드를 제공하기 위해 +1!). 방금 의 경우 0이 항상 캡처된다는 확실한 결론입니다. μμ=0
Wolfgang

2
(@Wolfgang) 이것은 신뢰 구간을 테스트하는 방법이 아닙니다. 정의는 수준 CI 가 모든 경우에 시간 의 평균 를 포함 할 것을 요구하지는 않는다 . (a) 모든 경우 에 적어도 그 정도의 범위를 가지고 있고 (b) 그 범위를 대략적으로 요구하는 것만 필요하다 일부 경우에. 따라서 접근 방식이 유효하고 설득력있게 되려면 많은 가능성을 찾아야합니다. 시도1 - αα1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
whuber

2
나는 당신이 만들고자하는 요점을 이해하지만 "이것은 신뢰 구간을 테스트하는 방법이 아니다"라는 진술에 강력히 동의하지 않습니다. CI의 정의 / 구성에서 매개 변수는 고정 상수입니다. 시뮬레이션에서 계속 변경됩니다. fixed 의 경우, 메소드가 실제로 95 % CI를 제공하는 경우 95 %의 경우 를 포함 해야합니다 . 그렇지 않습니다. 또한 구성에도 불구하고 1에 매우 가까운 범위를 제공합니다 (물론 이제 우리는 0으로 고정되는 에 다시 가까워지고 있습니다 ). μ μ μμμμsim(0.1)μ
Wolfgang

2
: @Wolfgang는이며 인용 논문에서 사용하는 정의를 점검 있다는 즉 확률 이고 간격이 0.95 이상 입니다. μP(Xζ|X|μX+ζ|X|)1αμ
Tim

2
다시, 는 상수입니다. 따라서 으로 시뮬레이션하는 것이 좋습니다. 물론 적용 범위는 1이어야합니다.이 방법은 적용 범위가 95 % 이상인 CI를 제공 하고 예제는 시뮬레이션 또는 추론을 통해 어떤 조건에서 적용 범위가 100 %에이를 수 있음을 보여줍니다. 따라서 95 % CI가 아닙니다. 아주 적은 정보로 어떤 종류의 추론을 이끌어내는 꽤 영리한 방법입니다. μ = 0μμ=0
Wolfgang

0

Edelman, D (1990) '샘플 크기 1을 기반으로 알 수없는 단봉 분포 중심에 대한 신뢰 구간'을 참조하십시오.


3
Stats.SE에 오신 것을 환영합니다. 인용 한 책의 요점을 포함시키기 위해 답을 수정하여 답장 해 주시겠습니까? 원본 포스터와이 사이트를 검색하는 다른 사람들에게 더 도움이 될 것입니다. 그건 그렇고, 아직 투어를 수행하지 않은 경우 둘러보기를 수행하십시오. 응답 방법 , 도움말 형식화LaTeX / MathJax를 사용한 방정식 작성 에 대한 팁도 참조하십시오 .
Ertxiem-

저희 사이트에 오신 것을 환영합니다. David. 이 기사의 저자 (여기에서 여러 스레드에서 인용되었다고 생각)에 대한 귀하의 기여는 대단히 감사합니다. 따라서이 답변에 제공 할 수있는 관점이나 의견은 가장 환영받을 것입니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.