표준 오차와 표준 편차의 차이를 이해하려고 애 쓰고 있습니다. 그것들은 어떻게 다르며 왜 표준 오차를 측정해야합니까?
표준 오차와 표준 편차의 차이를 이해하려고 애 쓰고 있습니다. 그것들은 어떻게 다르며 왜 표준 오차를 측정해야합니까?
답변:
질문에 대한 답을 완성하기 위해 Ocram은 표준 오차를 훌륭하게 해결했지만 표준 편차와 대조하지 않았으며 표본 크기에 대한 의존성을 언급하지 않았습니다. 추정기의 특별한 경우로 표본 평균을 고려하십시오. 평균의 표준 오차는 여기서σ는 모집단 표준 편차입니다. 따라서이 예에서는 표본 크기가 증가함에 따라 표준 오류가 어떻게 감소하는지 명시 적으로 확인합니다. 표준 편차는 개별 관측 값을 나타내는 데 가장 자주 사용됩니다. 따라서 표준 편차는 개별 관측치의 변동성을 설명하고 표준 오차는 추정기의 변동성을 나타냅니다. 좋은 추정치는 일관 적이므로 실제 모수 값으로 수렴합니다. 표본 크기가 증가함에 따라 표준 오차가 0으로 감소하면 추정값이 일관되며 대부분의 경우 표본 평균과 함께 명시 적으로 볼 때 표준 오차가 0으로 이동하기 때문에 발생합니다.
다음은 더 실용적인 (수학적이 아닌) 답변입니다.
평균뿐만 아니라 데이터에서 계산하는 거의 모든 매개 변수에 대해 표준 오류를 계산할 수 있습니다. "표준 오류"라는 문구는 약간 모호합니다. 위의 포인트는 평균의 표준 오차만을 나타냅니다.
( 내가 쓴 GraphPad Statistics Guide 에서)
(질문의 표준 오류에 중점을두고 있습니다.이 질문도 마찬가지라고 생각하지만 모든 샘플 통계에 대해 표준 오류를 생성 할 수 있습니다)
표준 오차는 표준 편차와 관련이 있지만 동일하지 않으며 표본 크기를 늘려도 더 가깝게 만들지는 않습니다. 오히려 그것들이 더 멀리 떨어져 있습니다. 표본 크기는 증가하지만 표준 오차는 증가하지 않으므로 표본의 표준 편차는 모집단 표준 편차에 가까워집니다.
때때로 이것에 대한 용어는 약간 두껍습니다.
표본을 수집하고 해당 표본의 표준 편차를 계산하면 표본의 크기가 커짐에 따라 표준 편차의 추정치가 더욱 정확 해집니다. 당신의 질문에서 당신이 생각하고 있었던 것 같습니다. 그러나 표본의 평균이 평균 모집단 평균에 더 가까운 경향이 있다는 점도 고려하십시오. 표준 오류를 이해하는 데 중요합니다.
표준 오차는 주어진 크기의 샘플이 여러 개있을 경우 어떻게되는지에 관한 것입니다. 10의 표본을 취하면 평균의 추정치를 얻을 수 있습니다. 그런 다음 10의 다른 표본과 새로운 평균 추정값 등을 가져옵니다. 해당 표본 평균의 표준 편차가 표준 오차입니다. 당신이 당신의 질문을 제기했다면, 아마도 N이 높으면 표본의 평균이 실제 값에서 크게 벗어날 가능성이 적기 때문에 표준 오차가 더 작다는 것을 알 수 있습니다.
하나의 샘플에서 이것을 계산했다는 것을 감안할 때 기적처럼 들립니다. 따라서 시뮬레이션을 통해 표준 오류를 부트 스트랩하여 관계를 보여줄 수 있습니다. R에서는 다음과 같습니다.
# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100
# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)
마지막 두 명령은 거의 같은 숫자를 생성합니다. n, m 및 s 값을 변경할 수 있으며 항상 서로 가깝게 나옵니다.