추정량과 통계량의 차이점은 무엇입니까?


30

통계는 샘플에서 얻을 수있는 속성이라는 것을 알았습니다. 동일한 크기의 많은 샘플을 가져 와서이 속성을 모두 계산하고 pdf를 플로팅하면 해당 속성의 분포 또는 해당 통계의 분포가 나타납니다.

또한 통계가 추정 자라는 말을 들었습니다.이 두 개념이 어떻게 다른가요?


2
모든 answears에 감사드립니다 ... 개념은 지금 나에게 훨씬 더 명확합니다 ..
gutto

답변:


17

정의

Wikipedia에서 :

통계 [...]는 샘플 (예를 들어, 그 산술 평균치)의 일부 속성의 단일 측정치이다.

[A] n 추정기 는 관측 된 데이터에 기초하여 [기본 분포의] 주어진 수량의 추정치를 계산하기위한 규칙입니다.

중요한 차이점은 다음과 같습니다.

  • 통계 시료의 함수이다.
  • 추정기는 샘플의 함수 인 분포 일정량 관련 .

"수량"의 ​​의미는 아래 섹션을 참조하십시오.

통계량은 추정치가 아닙니다

추정기는 A는 통계 추가 뭔가. 통계량을 추정량으로 바꾸려면 추정 할 목표 수량을 간단히 입력하면됩니다. 통계에 "실제"를 추가하지 않고 일부만 의도하기 때문에 혼란 스럽습니다.

차이가 중요하다는 것을 알기 위해서는 단순한 통계량 에 대한 추정량 (예 : 치우침 , 분산 등) 의 속성을 계산할 수 없음을 알아야합니다 . 치우침 을 계산하려면 통계가 제공하는 값과 실제 값의 차이를 찾아야합니다. 추정기에 만 바이어스를 계산할 수있는 "true value"가 제공됩니다. 통계는 데이터의 기능 일 뿐이며 옳지도 틀리지도 않습니다.

동일한 통계량을 기반으로하는 다른 추정기

동일한 통계량에 대해 다른 목표 수량을 철자하여 다른 추정량을 얻을 수 있습니다. 이러한 추정량은 모두 동일한 값, 동일한 통계량을 기반으로하지만 고유 한 편차를 갖습니다.

  • 표본 평균분포 평균 의 추정값으로 사용할 수 있습니다 . 이 추정기는 바이어스가 없습니다 .
  • 분포 평균 의 추정값으로 표본 평균 을 사용할 수도 있습니다 . 이 추정기는 대부분의 분포에 편향되어 있습니다.

따라서 "샘플 평균이 편차가 없다"고 말하는 것은 의미가 없습니다. 표본 평균을 사용하여 분포 평균을 추정하면 표본 평균이 편향되지 않습니다. 그러나 동시에 분포 분산을 추정하기 위해 사용할 때 편향됩니다.

분포의 양과 표본의 수량

여기서 수량 은 분포의 일부 특성을 말하며 일반적으로 알 수 없으므로 추정해야합니다. 이는 표본의 속성 인 통계 와 대조적 입니다. 예를 들어, 분포 평균분포 의 수량이며 표본 평균 은 통계 (샘플의 수량)입니다.


1
이 인용문들에는 명백한 잘못은 없지만, "수량"이 정확히 무엇을 의미하는지에 대해서는 당황하게합니다. 예를 들어 따옴표는 "수량"이 동일한 데이터를 기반으로하는 다른 통계이거나 다른 유사한 데이터를 기반으로하는 다른 통계 일 가능성을 배제하지 않는 것으로 보입니다. (후자의 경우 첫 번째 통계는 예측 변수 로 사용될 수 있습니다 . 전자의 경우에는 이름이 없다고 생각하지만 확실히 "추정자"는 아닙니다.)
whuber

@whuber 편집을 참조하십시오. 처음에 나는 짧은 대답을하고 싶었다 ... :(
ziggystar

아마도 평균이 평균 일 때 표본 평균과 표본 중앙값은 동일한 기본 값만 추정 할 것입니다.
Stumpy Joe Pete

나의 비판은 당신의 편집에 비추어 이해가되지 않습니다. 나는 많은 분포에서 중간 값! = 평균이라고 말하고 있었으므로 그러한 경우 샘플 중앙값과 샘플 평균이 같은 값으로 수렴하지 않습니다 (즉, 동일한 것을 추정하지 마십시오).
Stumpy Joe Pete

1
@Stumpy 여기에 약간의 오해가 있다고 생각합니다. 중앙값과 평균이 같은 것 (또는 전혀 다른 것)에 수렴되는지 여부는 중요하지 않습니다. 이것을 명확하게하기 위해, 조금 말도 안되게하겠습니다 : 원한다면, 표본 분산 을 사용 하여 평균을 추정 할 수 있습니다. 내가 이것을 할 수 없다고 말하는 이론적 제한은 없으며, 존재하지도 않습니다. 내 절차는 정의의 모든 부분을 수행합니다. 표본 분산은 실제로 통계량이고 평균은 실제로 기본 분포의 속성입니다. 정의의 경우 이것이 끔찍한 절차라는 것은 관련이 없습니다.
whuber

15

이 글은 약간 오래된 것이지만, Wikipedia의 정의가 바뀌었을 수도 있고, 정확하다면 더 명확하게 설명해줍니다.

"추정기"또는 "점 추정치"는 통계 모델에서 알 수없는 매개 변수의 값을 추론하는 데 사용되는 통계 (즉, 데이터의 함수)입니다.

따라서 통계는 데이터 자체와 해당 데이터를 사용한 계산을 나타냅니다. 추정기는 모형의 모수를 나타냅니다.

올바르게 이해하면 평균은 통계치이며 추정치 일 수도 있습니다. 표본의 평균은 통계량입니다 (샘플의 합을 표본 크기로 나눈 값). 표본의 평균은 정규 분포를 가정 할 때 모집단 평균의 추정값이기도합니다.

(새로운?) Wikipedia 인용문이 정확하다면 @ whuber 와이 물건을 정말로 아는 다른 사람들에게 물어볼 것입니다.


6
+1 기본적으로 옳다고 생각합니다. 추정기의 목표가 반드시 모델의 특정 "매개 변수"일 필요는 없다는 것을 알고 자 할 수 있습니다 . 모수의 함수와 같은 모델의 모든 특성 일 수 있습니다 . 예를 들어 는 정규 ( μ , σ 2 ) 모형 의 매개 변수가 아니지만 추정 할 수 있습니다. μ2(μ,σ2)
whuber

5

동일하다고 말하는 다른 답변은 권위있는 참조를 제공하지 않으므로 Casella와 Berger의 통계적 추론 핸드북 에서 두 가지 인용문을 드리겠습니다 .

정의 5.2.1 하자 임의의 크기의 샘플 수 N 인구에서와하자 T ( X 1 , ... , X N ) 도메인이 샘플 공간을 포함하는 가치 - 실제 또는 벡터 함수가 될 의 ( X 1 , ... , X의 N ) . 그런 다음 랜덤 변수 또는 랜덤 벡터 Y = T ( X 1 , , X n ) 가 호출됩니다.X1,,XnnT(x1,,xn)(X1,,Xn)Y=T(X1,,Xn)통계 . 통계 확률 분포 호출 샘플링 분포 Y .Y와이

정의 7.1.1포인트 추정기는 임의 함수이며 시료; 즉, 모든 통계는 포인트 추정기입니다.(엑스1,,엑스)

나는 여기에 이것이 질문에 대한 명확한 대답이라고 말하지는 않습니다 . 왜냐하면 차이점이 있음을 시사하는 두 가지 가장 많이 찬성 된 답변에 동의하는 것 같습니다. 명확한 사건.


4

"6"은 추정기의 예입니다. 당신의 질문이 "최고의 선형 함수 매핑 x에 y의 기울기는 무엇입니까?"라고 말하십시오. 대답은 "6"일 수 있습니다. 아니면 수 . 둘 다 견적 자입니다. 어느 쪽이 더 좋은지 결정해야합니다. (엑스'엑스)1엑스'와이

정말 좋은 TA는 그런 식으로 견적 자의 개념을 설명했습니다.

기본적으로 견적자는 가치를 모르는 수량을 얻기 위해 데이터에 적용하는 것입니다. 통계의 가치를 알고 있습니다. 통계에 대해 "최고"또는 "최적"이없는 데이터의 함수입니다. "최상의"평균은 없습니다. 의미가 있습니다.

1 인당 소유 한 염소 수와 각 사람의 행복에 대한 데이터 집합이 있다고 가정 해 봅시다. 사람들은 자신이 소유 한 염소의 수에 따라 사람들의 행복이 어떻게 변하는 지에 관심이 있습니다. 추정기는 데이터와의 관계를 추정하는 데 도움을 줄 수 있습니다. 통계는 보유한 데이터의 기능 일뿐입니다. 예를 들어, 염소 소유권의 분산은 7과 같습니다. 분산을 계산하는 공식은 염소와 토스트 자 사이에서 동일하거나 암에 걸릴 행복이나 성향에 관심이 있는지 여부와 동일합니다. 그런 의미에서 모든 합리적인 견적은 통계입니다.


3

흥미로운 질문입니다. 그러나 추정값과 통계가 다를 필요는 없습니다. 그것들은 다른 개념입니다.

통계는 입력이 (통계적) 데이터 인 함수 (광범위한 용어)입니다. 결과는 일반적으로이 통계에서 결과를 얻는 것입니다. 보다 추상적 인 용어로 통계는 둘 이상의 수를 산출 할 수 있습니다. 통계는 데이터에 따라 다르지만 절차는 결정적입니다. 따라서 통계는 "모든 수를 합산하고 카운트로 나눕니다"또는 더 넓은 의미에서 "gpd 데이터를 취하여 이에 대한 보고서를 작성합니다"일 수 있습니다.
통계적 의미에서 우리는 통계적으로 수학 함수에 대해 이야기하고 있습니다.

이것의 중요성은 입력 한 데이터의 속성 (예 : 임의의 변수가되는 변수)을 알고 있으면 실제로 경험적인 데이터를 넣지 않고도 통계의 속성을 계산할 수 있다는 것입니다.

견적자는 재산을 추정하려는 의도 때문에 견적 자입니다. 결과적으로 일부 통계는 좋은 추정치입니다.
예를 들어 iid 변수 풀에서 데이터 포인트를 가져 오면 가져온 데이터를 기반으로하는 통계 인 산술 평균 이 해당 분포의 예상 값을 추정 하는 데 도움 이됩니다. 그러나 다시 한 번 견적을내는 것은 견적 자입니다.

실제로는 사용하는 견적 도구가 통계 자료이지만 견적 도구가 아닌 통계 자료가 있습니다. 예를 들어, 테스트 통계-이 문장의 의미론에 대해 논쟁하고 문제를 악화시킬 수 있지만, 테스트 통계는 추정기뿐만 아니라 추정기도 포함 할 수 있습니다. 개념적으로는 그렇지 않아도됩니다.

물론 통계가 아닌 추정기를 가질 수는 있지만 추정에는 좋지 않습니다.


1
마지막 문장을 좀 더 자세히 설명해 주시겠습니까? 예를 들어, 크기가 iid 샘플을 고려하십시오 . 샘플에서 n 번째 및 n + 1 번째로 큰 값 중에서 선택하기 위해 코인 플립을 사용하여 모집단의 중앙값을 추정합니다 . (그것은 비록 그것이 "결정"절차가 아니기 때문에 당신의 정의에 따르면이, 통계 아닙니다 이다 통계는 공통의 일반적인 정의에 따라). 또한 합리적으로 좋은 견적 자입니다. "통계"가 아닌 "추정자"를 언급 할 때 어떤 종류의 객체를 염두에두고 있는지 궁금합니다. 2nnn+1
whuber

예, "값 선택"은 결정 론적 통계이며 사전에 선택한 모든 것은 선택한 샘플의 수정과 관련이 있습니다. 그런 다음 다시 "프로 시저"이후로 결정 론적이라면 통계에 대한 나의 정의에서 이와 같은 확률 론적 요소를 허용 할 수있다. 예를 들어 아래 답변의 숫자 "6"입니다. 비 통계 추정량이 반드시 나쁘다고 말하지는 않았습니다 .
IMA

1
나는 아마도 당신이 불필요하게 너무 많은 훌륭한 구별을하고 있다고 생각합니다. 결국 당신의 설명을 복잡하게 만듭니다. 예를 들어, "1/2"는 Bernoulli 변수의 매개 변수 (2 차 손실에 대한 최소값)의 훌륭한 추정값이므로 데이터와 독립적이기 때문에이를 배제하는 것이 부끄러운 일입니다. (이것은 유클리드 기하학에서 사각형의 예로 사각형을 계산하는 것과 유사합니다. 그렇게 할 수는 있지만 사각형의 속성에 관한 대부분의 문장 길이를 두 배로 늘릴 수 있습니다.) 무작위 통계를 배제하지 않는 것도 비슷합니다.
whuber

나는 우리가 실제로 같은 것에 대해 이야기하고 있다고 생각하지 않습니다. 어디에서 배제합니까? 절반이 훌륭한 견적 인 경우에는 그럴 수 있습니다. 통계에 속하지 않는 가능한 추정기의 대부분이 꽤 훌륭하다고 생각하지 않습니다. Bernoulli 변수의 경우 "1/2"가 좋습니다. 그러나 "실제 숫자"라는 클래스의 다른 평가자는 그다지 좋지 않습니다. 동의하지 않습니까? 무작위 통계에 대해서는 여전히 데이터를 기반으로합니다. 결정적 절차가 필요하다고 말하면서 배제하지 않았습니다. 그러나 나는 이것을 위에 추가해야한다는 것을 인정합니다.
IMA

2

샘플 이 무엇을 돕는 지 더 잘 이해한다고 생각합니다 .

[업데이트 됨 : 샘플은 매우 광범위한 개념으로, "임의의 샘플"에 대해 이야기하고있었습니다. 샘플이 무작위가 아닌 경우 추정기가 의미있는지 여부를 모르겠습니다 .]

에서 위키 피 디아 :

무작위 표본은 모집단의 각 개별 구성원이 표본의 일부로 선택 될 확률이 0이 아닌 알려진 표본으로 정의됩니다.

nn

추정기의 샘플을 샘플 값으로 대체합니다. 우리는 견적의 가치를 얻습니다. 이것은 특정한 척도입니다. 그리고이 특정 척도는 통계입니다.

( 추정자 정의에 대해서는 이 링크 를 확인하십시오 . 마지막 문장은 왜 우리가 항상 혼란스러워하는지 보여줍니다.)


1

이 글의 목표 :

여기서하고 싶은 것은 "통계"와 "추정기"라고하는 두 개의 밀접한 관련 개념 사이의 유사점과 차이점을 제공하는 것입니다. 그러나 매개 변수와 통계의 차이를 겪고 싶지 않습니다. 통계와 견적의 차이로 어려움을 겪고있는 모든 사람들에게 충분히 분명하다고 생각합니다. 그렇지 않은 경우 먼저 이전 게시물을 공부 한 후이 게시물을 공부해야합니다.

관계:

기본적으로 표본에서 관측 가능한 임의 변수의 실제 값 함수를 통계라고합니다. 잘 설계되고 좋은 속성 (예 : 일관성, ...)이있는 경우 인구 분포의 기본 분포에 대한 모수를 추정하는 데 사용할 수 있다는 통계가 있습니다. 따라서 통계는 큰 집합이고 추정기는 통계 집합의 하위 집합입니다. 따라서 모든 추정량이 통계량이지만 모든 통계량이 추정량 인 것은 아닙니다.

유사점 :

앞서 언급했듯이 유사점에 대해 말하면 둘 다 임의 변수의 함수입니다. 또한 둘 다 "샘플링 분포"라는 분포를 가지고 있습니다.

차이점 :

차이점에 대해 말하면 목표와 작업 측면에서 다릅니다. 통계의 목표와 과제는 (충분한 통계를 사용하여) 표본의 정보를 요약하고 때로는 가설 검정 등을 수행하는 것일 수 있습니다. 반대로, 추정기의 주요 목표와 과제는 이름에서 알 수 있듯이 추정하는 것입니다. 연구 대상 인구의 매개 변수. MOME, MLE, OLS 추정기 등과 같이 자체 계산 논리가있는 다양한 추정기가 있다는 것을 언급하는 것이 중요합니다. 이 두 개념의 또 다른 차이점은 원하는 속성과 관련이 있습니다. 통계의 가장 바람직한 속성 중 하나는 "충분 성"이지만 추정기의 원하는 속성은 "일관성", "편견 없음", "정밀도"등과 같은 것입니다.

주의:

따라서 통계 및 추정자를 처리 할 때 용어를 올바르게 사용하는 데주의를 기울여야합니다. 예를 들어, 단순한 통계의 편향에 대해 이야기하는 것은 의미가 없습니다. 이는 통계가 아닙니다. 왜냐하면 우리가 편견을 계산할 수 있도록 그러한 맥락에 관련된 매개 변수가 없기 때문입니다. 에 대해 말하다. 따라서 용어에주의해야합니다!

결론:

요약하면, 표본에서 관측 가능한 랜덤 변수의 함수는 통계입니다. 통계량에 모집단의 모수를 추정 할 수있는 능력이있는 경우이를 관심있는 모수의 추정량이라고합니다. 그러나 모수를 추정하도록 설계되지 않은 일부 통계가 있으므로 이러한 통계는 추정기가 아니며 여기서는 "단순 통계"라고합니다.

위에서 제공 한 것은이 두 가지 개념을보고 생각하는 방식이며 간단한 단어로 표현하기 위해 최선을 다했습니다. 도움이 되길 바랍니다!


0

기존 Q에 대한 새로운 답변 :

정의 1. 통계는 실수 각 샘플을 매핑하는 기능입니다.

모든 추정량은 통계량입니다.

그러나 우리는 추정치를 생성하는 데 사용되는 통계 ( "추측")만을 호출하는 경향이 있습니다.

예를 들어, t- 통계량과 표본 평균은 둘 다 통계입니다. 표본 평균은 추정량이기도합니다 (실제 모집단 평균을 추정하기 위해 종종 사용하기 때문에).

대조적으로, 우리는 t- 통계량을 추정량이라고 부르지 않습니다. 매개 변수를 추정하기 위해 사용하지 않기 때문입니다.

PQ

Example_

θ

θ

가능한 방법이 하나 있습니다. 우리는 주사위를 3 번 ​​굴립니다.

s=(x1,x2,x3)x1x2x3

s1=(5,4,1)s2=(4,1,6)s3=(6,3,2)

PQPQs=(x1,x2,x3)

P(s)=x1ln(x2+x3),
Q(s)=x1+x2+x33.

P

Qθ

θ


1
이 답변은 좋은 방향으로 향하고 있습니다. 그러나 "정의 2"는 원형으로 인해 유효한 정의로 보이지 않습니다 (후자를 설명하지 않고 "추정"으로 "추정기"를 정의 함). 그것이 효과적이기 위해서는 사람들이 추정기가 얼마나 잘 작동하는지에 대한 정량적 측정을 공식화 할 수있는 "모수 추정치"가 충분히 상세하고 명확하게 설명되어 있어야합니다.
whuber

@ whuber : 간단하게 유지하려고합니다. 매개 변수는 실수입니다 (예 : 평균 결과)θ다이 롤). 비공식적으로, 매개 변수의 추정치는 단순히 매개 변수가 무엇인지 "추측"입니다. 따라서 추정치는 단순히 실수이기도합니다. (예 :θ 이다 5.) // "추정자가 얼마나 잘 작동하는지에 대한 정량적 측정을 구성하는 방법"이라는 문제는 통계와 추정 자의 구별에 대한 더 단순하고 기본적인 질문과는 완전히 다릅니다. 여기에 어떤 질문이 있습니까?
Kenny LJ

2
불행히도, 내가 제안하려고했던 것처럼, 두 번째 정의가 견적을 다른 통계와 전혀 구별하지 않기 때문에 중요한 것이 단순화 된 것에서 잃어버린 것 같습니다.
whuber

@ whuber : 맞습니다. 공식적으로 견적자는 통계 일뿐입니다. 그러나 통계가 일부 관심 대상 매개 변수를 추정하는 데 사용되는 경우 통계를 나타내는 데 "estimator"라는 단어를 사용하는 경향이 있습니다. 이 점을 명확히하기 위해 답변을 편집했습니다.
Kenny LJ

-3

In hypothesis testing :

검정 통계량은 가설 검정에 관한 것입니다. 검정-통계량은 귀무 가설에 따라 주어진 / 가닥의 랜덤 변수입니다. 이제 일부는 표본에 주어진 통계량의 값을 통계량이라고 할 수도 있습니다.

이 두 값을 사용하면 귀무 가설을 기각하거나 기각하지 않는 측정 값 인 p- 값을 얻을 수 있습니다. 전체적으로 통계는 가설과 얼마나 멀리 / 가까운지를 추정 한 것입니다.

링크 가 유용 할 수 있습니다.


2
추정보다는 가설 검정과 관련된 다른 질문을 다루는 것 같습니다. "통계"에 대한 정의는 표준 정의보다 범위에서 훨씬 더 제한적입니다. 통계는 매우 제한된 가설 검정 사례 및 귀무 가설뿐만 아니라 모든 형태의 의사 결정에 적용됩니다. 또한 가설 검정은 추정기와 동일하지 않으며 대부분의 통계는 일부 가설에 근접한 추정기로 사용되지 않습니다.
whuber

나는 그것이 다른 질문이라고 말하지 않을 것입니다. 그것은 적어도 가설 검정의 맥락에서 그것이 무엇인지에 대한 그림을 제공합니다!
dfhgfh

2
이 답변은 제한적이고 전문화 된 버전의 질문에 초점을 맞추고 독자에게 그 사실을 알리지 않고 "추정자"와 "통계"라는 핵심 용어를 틀에 얽매이지 않기 때문에 사람들을 오도하거나 혼동 할 수 있다고 걱정합니다.
whuber

가설 검정은 제한적이고 전문화 된 통계 분야라고 생각했습니다.
dfhgfh
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.