답변:
Wikipedia에서 :
통계 [...]는 샘플 (예를 들어, 그 산술 평균치)의 일부 속성의 단일 측정치이다.
과
[A] n 추정기 는 관측 된 데이터에 기초하여 [기본 분포의] 주어진 수량의 추정치를 계산하기위한 규칙입니다.
중요한 차이점은 다음과 같습니다.
"수량"의 의미는 아래 섹션을 참조하십시오.
추정기는 A는 통계 추가 뭔가. 통계량을 추정량으로 바꾸려면 추정 할 목표 수량을 간단히 입력하면됩니다. 통계에 "실제"를 추가하지 않고 일부만 의도하기 때문에 혼란 스럽습니다.
차이가 중요하다는 것을 알기 위해서는 단순한 통계량 에 대한 추정량 (예 : 치우침 , 분산 등) 의 속성을 계산할 수 없음을 알아야합니다 . 치우침 을 계산하려면 통계가 제공하는 값과 실제 값의 차이를 찾아야합니다. 추정기에 만 바이어스를 계산할 수있는 "true value"가 제공됩니다. 통계는 데이터의 기능 일 뿐이며 옳지도 틀리지도 않습니다.
동일한 통계량에 대해 다른 목표 수량을 철자하여 다른 추정량을 얻을 수 있습니다. 이러한 추정량은 모두 동일한 값, 동일한 통계량을 기반으로하지만 고유 한 편차를 갖습니다.
따라서 "샘플 평균이 편차가 없다"고 말하는 것은 의미가 없습니다. 표본 평균을 사용하여 분포 평균을 추정하면 표본 평균이 편향되지 않습니다. 그러나 동시에 분포 분산을 추정하기 위해 사용할 때 편향됩니다.
여기서 수량 은 분포의 일부 특성을 말하며 일반적으로 알 수 없으므로 추정해야합니다. 이는 표본의 속성 인 통계 와 대조적 입니다. 예를 들어, 분포 평균 은 분포 의 수량이며 표본 평균 은 통계 (샘플의 수량)입니다.
이 글은 약간 오래된 것이지만, Wikipedia의 정의가 바뀌었을 수도 있고, 정확하다면 더 명확하게 설명해줍니다.
"추정기"또는 "점 추정치"는 통계 모델에서 알 수없는 매개 변수의 값을 추론하는 데 사용되는 통계 (즉, 데이터의 함수)입니다.
따라서 통계는 데이터 자체와 해당 데이터를 사용한 계산을 나타냅니다. 추정기는 모형의 모수를 나타냅니다.
올바르게 이해하면 평균은 통계치이며 추정치 일 수도 있습니다. 표본의 평균은 통계량입니다 (샘플의 합을 표본 크기로 나눈 값). 표본의 평균은 정규 분포를 가정 할 때 모집단 평균의 추정값이기도합니다.
(새로운?) Wikipedia 인용문이 정확하다면 @ whuber 와이 물건을 정말로 아는 다른 사람들에게 물어볼 것입니다.
동일하다고 말하는 다른 답변은 권위있는 참조를 제공하지 않으므로 Casella와 Berger의 통계적 추론 핸드북 에서 두 가지 인용문을 드리겠습니다 .
정의 5.2.1 하자 임의의 크기의 샘플 수 N 인구에서와하자 T ( X 1 , ... , X N ) 도메인이 샘플 공간을 포함하는 가치 - 실제 또는 벡터 함수가 될 의 ( X 1 , ... , X의 N ) . 그런 다음 랜덤 변수 또는 랜덤 벡터 Y = T ( X 1 , … , X n ) 가 호출됩니다.통계 . 통계 확률 분포 호출 샘플링 분포 Y .
과
정의 7.1.1 의 포인트 추정기는 임의 함수이며 시료; 즉, 모든 통계는 포인트 추정기입니다.
나는 여기에 이것이 질문에 대한 명확한 대답이라고 말하지는 않습니다 . 왜냐하면 차이점이 있음을 시사하는 두 가지 가장 많이 찬성 된 답변에 동의하는 것 같습니다. 명확한 사건.
"6"은 추정기의 예입니다. 당신의 질문이 "최고의 선형 함수 매핑 x에 y의 기울기는 무엇입니까?"라고 말하십시오. 대답은 "6"일 수 있습니다. 아니면 수 . 둘 다 견적 자입니다. 어느 쪽이 더 좋은지 결정해야합니다.
정말 좋은 TA는 그런 식으로 견적 자의 개념을 설명했습니다.
기본적으로 견적자는 가치를 모르는 수량을 얻기 위해 데이터에 적용하는 것입니다. 통계의 가치를 알고 있습니다. 통계에 대해 "최고"또는 "최적"이없는 데이터의 함수입니다. "최상의"평균은 없습니다. 의미가 있습니다.
1 인당 소유 한 염소 수와 각 사람의 행복에 대한 데이터 집합이 있다고 가정 해 봅시다. 사람들은 자신이 소유 한 염소의 수에 따라 사람들의 행복이 어떻게 변하는 지에 관심이 있습니다. 추정기는 데이터와의 관계를 추정하는 데 도움을 줄 수 있습니다. 통계는 보유한 데이터의 기능 일뿐입니다. 예를 들어, 염소 소유권의 분산은 7과 같습니다. 분산을 계산하는 공식은 염소와 토스트 자 사이에서 동일하거나 암에 걸릴 행복이나 성향에 관심이 있는지 여부와 동일합니다. 그런 의미에서 모든 합리적인 견적은 통계입니다.
흥미로운 질문입니다. 그러나 추정값과 통계가 다를 필요는 없습니다. 그것들은 다른 개념입니다.
통계는 입력이 (통계적) 데이터 인 함수 (광범위한 용어)입니다. 결과는 일반적으로이 통계에서 결과를 얻는 것입니다. 보다 추상적 인 용어로 통계는 둘 이상의 수를 산출 할 수 있습니다. 통계는 데이터에 따라 다르지만 절차는 결정적입니다. 따라서 통계는 "모든 수를 합산하고 카운트로 나눕니다"또는 더 넓은 의미에서 "gpd 데이터를 취하여 이에 대한 보고서를 작성합니다"일 수 있습니다.
통계적 의미에서 우리는 통계적으로 수학 함수에 대해 이야기하고 있습니다.
이것의 중요성은 입력 한 데이터의 속성 (예 : 임의의 변수가되는 변수)을 알고 있으면 실제로 경험적인 데이터를 넣지 않고도 통계의 속성을 계산할 수 있다는 것입니다.
견적자는 재산을 추정하려는 의도 때문에 견적 자입니다. 결과적으로 일부 통계는 좋은 추정치입니다.
예를 들어 iid 변수 풀에서 데이터 포인트를 가져 오면 가져온 데이터를 기반으로하는 통계 인 산술 평균 이 해당 분포의 예상 값을 추정 하는 데 도움 이됩니다. 그러나 다시 한 번 견적을내는 것은 견적 자입니다.
실제로는 사용하는 견적 도구가 통계 자료이지만 견적 도구가 아닌 통계 자료가 있습니다. 예를 들어, 테스트 통계-이 문장의 의미론에 대해 논쟁하고 문제를 악화시킬 수 있지만, 테스트 통계는 추정기뿐만 아니라 추정기도 포함 할 수 있습니다. 개념적으로는 그렇지 않아도됩니다.
물론 통계가 아닌 추정기를 가질 수는 있지만 추정에는 좋지 않습니다.
샘플 이 무엇을 돕는 지 더 잘 이해한다고 생각합니다 .
[업데이트 됨 : 샘플은 매우 광범위한 개념으로, "임의의 샘플"에 대해 이야기하고있었습니다. 샘플이 무작위가 아닌 경우 추정기가 의미 가 있는지 여부를 모르겠습니다 .]
에서 위키 피 디아 :
무작위 표본은 모집단의 각 개별 구성원이 표본의 일부로 선택 될 확률이 0이 아닌 알려진 표본으로 정의됩니다.
추정기의 샘플을 샘플 값으로 대체합니다. 우리는 견적의 가치를 얻습니다. 이것은 특정한 척도입니다. 그리고이 특정 척도는 통계입니다.
( 추정자 정의에 대해서는 이 링크 를 확인하십시오 . 마지막 문장은 왜 우리가 항상 혼란스러워하는지 보여줍니다.)
이 글의 목표 :
여기서하고 싶은 것은 "통계"와 "추정기"라고하는 두 개의 밀접한 관련 개념 사이의 유사점과 차이점을 제공하는 것입니다. 그러나 매개 변수와 통계의 차이를 겪고 싶지 않습니다. 통계와 견적의 차이로 어려움을 겪고있는 모든 사람들에게 충분히 분명하다고 생각합니다. 그렇지 않은 경우 먼저 이전 게시물을 공부 한 후이 게시물을 공부해야합니다.
관계:
기본적으로 표본에서 관측 가능한 임의 변수의 실제 값 함수를 통계라고합니다. 잘 설계되고 좋은 속성 (예 : 일관성, ...)이있는 경우 인구 분포의 기본 분포에 대한 모수를 추정하는 데 사용할 수 있다는 통계가 있습니다. 따라서 통계는 큰 집합이고 추정기는 통계 집합의 하위 집합입니다. 따라서 모든 추정량이 통계량이지만 모든 통계량이 추정량 인 것은 아닙니다.
유사점 :
앞서 언급했듯이 유사점에 대해 말하면 둘 다 임의 변수의 함수입니다. 또한 둘 다 "샘플링 분포"라는 분포를 가지고 있습니다.
차이점 :
차이점에 대해 말하면 목표와 작업 측면에서 다릅니다. 통계의 목표와 과제는 (충분한 통계를 사용하여) 표본의 정보를 요약하고 때로는 가설 검정 등을 수행하는 것일 수 있습니다. 반대로, 추정기의 주요 목표와 과제는 이름에서 알 수 있듯이 추정하는 것입니다. 연구 대상 인구의 매개 변수. MOME, MLE, OLS 추정기 등과 같이 자체 계산 논리가있는 다양한 추정기가 있다는 것을 언급하는 것이 중요합니다. 이 두 개념의 또 다른 차이점은 원하는 속성과 관련이 있습니다. 통계의 가장 바람직한 속성 중 하나는 "충분 성"이지만 추정기의 원하는 속성은 "일관성", "편견 없음", "정밀도"등과 같은 것입니다.
주의:
따라서 통계 및 추정자를 처리 할 때 용어를 올바르게 사용하는 데주의를 기울여야합니다. 예를 들어, 단순한 통계의 편향에 대해 이야기하는 것은 의미가 없습니다. 이는 통계가 아닙니다. 왜냐하면 우리가 편견을 계산할 수 있도록 그러한 맥락에 관련된 매개 변수가 없기 때문입니다. 에 대해 말하다. 따라서 용어에주의해야합니다!
결론:
요약하면, 표본에서 관측 가능한 랜덤 변수의 함수는 통계입니다. 통계량에 모집단의 모수를 추정 할 수있는 능력이있는 경우이를 관심있는 모수의 추정량이라고합니다. 그러나 모수를 추정하도록 설계되지 않은 일부 통계가 있으므로 이러한 통계는 추정기가 아니며 여기서는 "단순 통계"라고합니다.
위에서 제공 한 것은이 두 가지 개념을보고 생각하는 방식이며 간단한 단어로 표현하기 위해 최선을 다했습니다. 도움이 되길 바랍니다!
기존 Q에 대한 새로운 답변 :
정의 1. 의 통계는 실수 각 샘플을 매핑하는 기능입니다.
모든 추정량은 통계량입니다.
그러나 우리는 추정치를 생성하는 데 사용되는 통계 ( "추측")만을 호출하는 경향이 있습니다.
예를 들어, t- 통계량과 표본 평균은 둘 다 통계입니다. 표본 평균은 추정량이기도합니다 (실제 모집단 평균을 추정하기 위해 종종 사용하기 때문에).
대조적으로, 우리는 t- 통계량을 추정량이라고 부르지 않습니다. 매개 변수를 추정하기 위해 사용하지 않기 때문입니다.
가능한 방법이 하나 있습니다. 우리는 주사위를 3 번 굴립니다.
In hypothesis testing :
검정 통계량은 가설 검정에 관한 것입니다. 검정-통계량은 귀무 가설에 따라 주어진 / 가닥의 랜덤 변수입니다. 이제 일부는 표본에 주어진 통계량의 값을 통계량이라고 할 수도 있습니다.
이 두 값을 사용하면 귀무 가설을 기각하거나 기각하지 않는 측정 값 인 p- 값을 얻을 수 있습니다. 전체적으로 통계는 가설과 얼마나 멀리 / 가까운지를 추정 한 것입니다.
이 링크 가 유용 할 수 있습니다.