표준 오차와 표준 편차의 차이


96

표준 오차와 표준 편차의 차이를 이해하려고 애 쓰고 있습니다. 그것들은 어떻게 다르며 왜 표준 오차를 측정해야합니까?


7
두 가지 유용한 주석이 이미 존재하기 때문에 답이 아닌 빠른 주석 : 표준 편차는 랜덤 변수의 (분포) 속성입니다. 표준 오차는 대신 특정 샘플의 측정과 관련이 있습니다. 유니버스와 샘플의 구분을 흐리게하면 둘이 혼동 될 수 있습니다.
프란체스코

답변:


31

질문에 대한 답을 완성하기 위해 Ocram은 표준 오차를 훌륭하게 해결했지만 표준 편차와 대조하지 않았으며 표본 크기에 대한 의존성을 언급하지 않았습니다. 추정기의 특별한 경우로 표본 평균을 고려하십시오. 평균의 표준 오차는 여기서σ는 모집단 표준 편차입니다. 따라서이 예에서는 표본 크기가 증가함에 따라 표준 오류가 어떻게 감소하는지 명시 적으로 확인합니다. 표준 편차는 개별 관측 값을 나타내는 데 가장 자주 사용됩니다. 따라서 표준 편차는 개별 관측치의 변동성을 설명하고 표준 오차는 추정기의 변동성을 나타냅니다. 좋은 추정치는 일관 적이므로 실제 모수 값으로 수렴합니다. 표본 크기가 증가함에 따라 표준 오차가 0으로 감소하면 추정값이 일관되며 대부분의 경우 표본 평균과 함께 명시 적으로 볼 때 표준 오차가 0으로 이동하기 때문에 발생합니다.σ/σ


3
다시 : "... 일관된 표준 오류가 0으로 줄어드는 것을 의미합니다."-사실이 아닙니다. stats.stackexchange.com/questions/31036/… 토론을 기억하십니까 ?
매크로

1
물론 나는 예외적 인 예외에 대한 토론을 기억하고 질문에 대답했을 때 그것에 대해 생각하고있었습니다. 그러나 문제는 표준 오차에 관한 것이며 간단한 용어로 좋은 모수 추정치는 일관되며 표본 평균의 경우와 같이 표준 오차가 0 인 경향이 있습니다.
Michael Chernick

4
귀하의 의견에 동의합니다-표본 평균의 표준 오차가 0이 되고 표본 평균이 일치합니다. 그러나 표준 오류가 0이되는 것은 그것이 일관성이 있다는 사실의 결과가 아니거나 귀하의 답변이 말하는 것입니다.
매크로

3
@ Macro 예, 내가하기로 결정한 대답이 향상 될 수 있습니다. 자격을 갖추는 것이 복잡하고 혼란을 줄 수 있으므로 OP에 너무 기술적이지 않는 것이 중요하다고 생각합니다. 그러나 단순성을 위해 기술적 정확성을 희생해서는 안됩니다. 편집에서이 문제를 해결하는 방법이이 작업을 수행하는 가장 좋은 방법이라고 생각합니다.
Michael Chernick

9
나는 절대적으로 필요한 경우가 아니면 기술을 얻지 않는 것이 중요하다는 데 동의합니다. 저의 유일한 의견은 일단 일관성 개념 (기술 개념)을 도입하기로 선택한 후에는 대답을보다 쉽게 ​​이해할 수 있도록 이름을 잘못 설명하는 데 쓸모가 없다는 것입니다. 그래도 편집 내용이 내 의견을 처리한다고 생각합니다.
매크로

51

다음은 더 실용적인 (수학적이 아닌) 답변입니다.

  • SD (표준 편차)는 산란을 수치로 나타냅니다. 값이 서로 얼마나 다른지.
  • SEM (평균의 표준 오차)은 모집단의 실제 평균을 얼마나 정확하게 알고 있는지를 정량화합니다. SD 값과 샘플 크기를 모두 고려합니다.
  • SD와 SEM은 모두 동일한 단위 (데이터 단위)에 있습니다.
  • SEM은 정의상 항상 SD보다 작습니다.
  • 샘플이 클수록 SEM이 작아집니다. 큰 표본의 평균이 작은 표본의 평균보다 실제 모집단 평균에 더 가깝기 때문에 이는 의미가 있습니다. 거대한 표본을 사용하면 데이터가 매우 흩어져 있어도 평균의 값을 정밀하게 알 수 있습니다.
  • 더 많은 데이터를 수집 할 때 SD는 예상대로 변경되지 않습니다. 표본에서 계산 한 SD는 전체 모집단의 SD에 대한 최상의 추정치입니다. 더 많은 데이터를 수집할수록 모집단의 SD를 더 정확하게 평가할 수 있습니다. 그러나 더 큰 샘플의 SD가 작은 샘플의 SD보다 큰지 작은지를 예측할 수 없습니다. (이것은 사실이 아니라 단순화 된 것입니다. 아래 주석을 참조하십시오.)

평균뿐만 아니라 데이터에서 계산하는 거의 모든 매개 변수에 대해 표준 오류를 계산할 수 있습니다. "표준 오류"라는 문구는 약간 모호합니다. 위의 포인트는 평균의 표준 오차만을 나타냅니다.

( 내가 쓴 GraphPad Statistics Guide 에서)


11
100.18=2

4
@ whuber : 물론 그렇습니다. 더 많은 데이터를 추가해도 예측할 수없는 분산 (SD 제곱)입니다. SD는 샘플 크기가 증가함에 따라, 특히 작은 샘플로 시작할 때 약간 커집니다. 이 변화는 샘플 크기가 변함에 따라 SEM의 변화와 비교하여 아주 작습니다.
Harvey Motulsky

@HarveyMotulsky : 왜 sd가 증가합니까?
Andrew

표본이 크면 표본 분산이 모집단 분산에 매우 가까우므로 표본 SD는 모집단 SD에 가깝습니다. 표본이 작을수록 표본 분산은 평균 모집단 분산과 같지만 불일치가 더 큽니다. 분산으로 대칭 인 경우 SD와 비대칭입니다. 예 : 모집단 분산은 100입니다. 두 표본 분산은 80 또는 120 (대칭)입니다. 샘플 SD는 10이어야하지만 8.94 또는 10.95입니다. 모집단 분산 주위에 대칭 유통, 평균 SD의 평균 샘플 표준 편차는 낮은 N.과 함께, 낮은 것
하비 Motulsky

43

θ엑스={엑스1,,엑스}θθ^(엑스)θ^(엑스)엑스엑스~θ^(엑스~)θ^(엑스)θ^θ^(엑스)θ^


1
추정의 표준 오차가 추정 변수의 표준 편차와 같습니까?
Yurii

6

(질문의 표준 오류에 중점을두고 있습니다.이 질문도 마찬가지라고 생각하지만 모든 샘플 통계에 대해 표준 오류를 생성 할 수 있습니다)

표준 오차는 표준 편차와 관련이 있지만 동일하지 않으며 표본 크기를 늘려도 더 가깝게 만들지는 않습니다. 오히려 그것들이 더 멀리 떨어져 있습니다. 표본 크기는 증가하지만 표준 오차는 증가하지 않으므로 표본의 표준 편차는 모집단 표준 편차에 가까워집니다.

때때로 이것에 대한 용어는 약간 두껍습니다.

표본을 수집하고 해당 표본의 표준 편차를 계산하면 표본의 크기가 커짐에 따라 표준 편차의 추정치가 더욱 정확 해집니다. 당신의 질문에서 당신이 생각하고 있었던 것 같습니다. 그러나 표본의 평균이 평균 모집단 평균에 더 가까운 경향이 있다는 점도 고려하십시오. 표준 오류를 이해하는 데 중요합니다.

표준 오차는 주어진 크기의 샘플이 여러 개있을 경우 어떻게되는지에 관한 것입니다. 10의 표본을 취하면 평균의 추정치를 얻을 수 있습니다. 그런 다음 10의 다른 표본과 새로운 평균 추정값 등을 가져옵니다. 해당 표본 평균의 표준 편차가 표준 오차입니다. 당신이 당신의 질문을 제기했다면, 아마도 N이 높으면 표본의 평균이 실제 값에서 크게 벗어날 가능성이 적기 때문에 표준 오차가 더 작다는 것을 알 수 있습니다.

하나의 샘플에서 이것을 계산했다는 것을 감안할 때 기적처럼 들립니다. 따라서 시뮬레이션을 통해 표준 오류를 부트 스트랩하여 관계를 보여줄 수 있습니다. R에서는 다음과 같습니다.

# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100

# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)

마지막 두 명령은 거의 같은 숫자를 생성합니다. n, m 및 s 값을 변경할 수 있으며 항상 서로 가깝게 나옵니다.


게시 해 주셔서 감사합니다. 그러면 표준 오차를 "샘플링 분포의 표준 편차"로 묘사하는 것이 공정합니까? 위의 코드 블록에서 샘플링 분포가 y입니까? 이것은 샘플 매개 변수 sd를 팽창시키고 샘플링 분포 매개 변수를 의미하는 나를 혼란스럽게합니다.
Doug Fir

1
이 경우에 대한 표본 평균을 지정하도록 문구를 변경하면 예입니다.
John
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.