내가 분명한 것을 놓친 경우 용서하십시오.
저는 정규 분포에 근사한 평균값을 중심으로 본질적으로 (히스토그램) 분포를 가진 물리학 자입니다. 나에게 중요한 값은이 가우스 랜덤 변수의 표준 편차입니다. 표본 표준 편차에서 오류를 찾으려면 어떻게해야합니까? 원래 히스토그램의 각 빈에 대한 오류와 관련이 있다고 생각합니다.
내가 분명한 것을 놓친 경우 용서하십시오.
저는 정규 분포에 근사한 평균값을 중심으로 본질적으로 (히스토그램) 분포를 가진 물리학 자입니다. 나에게 중요한 값은이 가우스 랜덤 변수의 표준 편차입니다. 표본 표준 편차에서 오류를 찾으려면 어떻게해야합니까? 원래 히스토그램의 각 빈에 대한 오류와 관련이 있다고 생각합니다.
답변:
샘플 표준 편차의 표준 편차 계산을 요청하는 것처럼 들립니다. 즉, . 여기서
및 는 표본 평균입니다.
먼저 분산의 기본 속성에서
표본 분산이 편향되지 않으므로 입니다. 에서 왜 표본 표준 편차의 바이어스 추정이다 ? , 우리는 추정 할 수있는 를 계산합니다σ E ( S )
따라서
수량 와 카이 제곱 분포있다 자유도를 샘플 독립적이 수량이 신뢰를 얻기 위해 이용 될 수있는 동일한 정규 분포와 함께 배포 할 때 법선의 편차와 표준 편차의 간격. 빈의 중심 값뿐만 아니라 원시 값이있는 경우 계산할 수 있습니다 . n - 1 s 2
가 자유도를 갖는 카이 제곱 분포를 갖는 그 분산은 것으로 알려져있다 . 이것 사실 알면서 우리가 얻을 분산을 가지고 같 하지만 알 수없는 당신하여 대략적인 수 당신은의 분산 무엇을 거친 생각이 입니다.n − 1 2 ( n − 1 ) V a r ( c X ) = c 2 V a r ( X ) s 2 2 ( n − 1 ) σ 4σ 4 s 4 s 2
일반적인 경우 표준 편차의 오차를 정량화하는 방법에는 여러 가지가 있습니다. 신뢰 구간을 근사화하는 데 사용할 수있는 의 프로파일 가능성을 제시하겠습니다 .
하자 일반 상태에서의 샘플 수 . 해당 우도 함수는( μ , σ )
그런 다음 최대 가능성 추정값은 로 주어집니다 . 여기서 . 의 오류를 수량화하는 데 관심 이있는 경우 다음과 같이이 매개 변수의 정규화 된 프로파일 가능성을 계산할 수 있습니다.S = √σ
참고 수준의 간격. 의 대략적인 신뢰 한 다음으로는 연결합니다. 이러한 간격을 계산 사용할 수있는 코드는 당신이 그것을 수정할 수 있습니다. 따라서 귀하의 상황에서 (또는 데이터를 게시하는 경우 이러한 변경 사항을 포함시킬 수 있습니다).0.147 0.95 R
data = rnorm(30)
n = length(data)
sg = sqrt(mean((data-mean(data))^2))
# Profile likelihood
rp = function(sigma) return( (sg/sigma)^n*exp(0.5*n*(1-(sg/sigma)^2)) )
vec = rvec = seq(0.5,1.5,0.01)
for(i in 1:length(rvec)) rvec[i] = rp(vec[i])
plot(vec,rvec,type="l")
rpc = function(sigma) return(rp(sigma)-0.147)
# Approximate 95% confidence interval
c(uniroot(rpc,c(0.7,0.8))$root,uniroot(rpc,c(1.1,1.3))$root)
이러한 종류의 간격의 이점은 변환시 변하지 않는다는 것입니다. 이 경우 , 의 간격을 계산하면 의 해당 간격 은 간단히 입니다.I = ( L , U ) σ 2 I ' = ( L 2 , U 2 )