기술 통계량과 추론 통계의 차이점은 무엇입니까?


21

필자는 이해 통계가 데이터 샘플의 기능을 정량적으로 설명하는 반면 추론 통계는 샘플을 추출한 모집단에 대해 추론했다는 것을 이해했습니다.

그러나 통계적 추론 상태에 대한 Wikipedia 페이지는 다음과 같습니다.

대부분의 경우 통계적 추론은 임의의 형태의 무작위 표본 추출을 통해 관심있는 모집단에서 얻은 데이터를 사용하여 모집단에 대해 제안합니다.

"대부분"은 내가이 개념들을 제대로 이해하지 못한다고 생각하게했다. 모집단에 대해 제안하지 않는 추론 통계의 예가 있습니까?


기술 통계 : 동전을 10 번 던지고 6 번 머리를 내 렸습니다. 통계적 추론 : 헤드 확률의 최대 가능성 추정치는 이거나,이 정보는 동전이 공정한 동전이라는 가설을 기각하기에 충분하지 않습니다. 0.6
Dilip Sarwate

2
"인구"개념이없는 추론 : 데이터가 (일부) 알려지지 않은 임의의 메커니즘 / 규칙에 의해 생성되었다고 가정합니다. 추론 적 방법을 통해 데이터를 기반으로이 메커니즘의 속성을 평가할 수 있습니다. 예 : 대략 또는 불완전한 조건에서만 측정 할 수있는 결과를 기반으로 전기-물리적 공식을 확인하려고합니다.
Michael M

1
@ 마이클 : 예; 또는 참으로 만든다 실험 치료의 무작위 할당 - 데이터가 알려진 임의의 메커니즘에 의해 생성 될 수있다.
Scortchi-Monica Monica 복원

답변:


19

행동 과학 배경에서 비롯된이 용어는 특히 입문 통계 교과서와 관련이 있습니다. 이와 관련하여 구별은 다음과 같습니다.

  • 기술 통계량 은 데이터의 일부 기능을 설명하는 데 본질적으로 흥미로운 샘플 데이터의 기능입니다. 고전적인 기술 통계에는 평균, 최소, 최대, 표준 편차, 중앙값, 기울기, 첨도가 포함됩니다.
  • 추론 통계 는 모집단 모수에 대한 가설을 추론하는 데 도움이되는 표본 데이터의 함수입니다. 고전적인 추론 통계에는 z, t, , F- 비 등이 있습니다.χ2

중요한 점은 모든 통계, 추론 또는 설명이 표본 데이터의 함수라는 점입니다. 모수는 모집단의 함수이며, 여기서 모집단이라는 용어는 기본 데이터 생성 프로세스를 말하는 것과 같습니다.

이 관점에서 기술 또는 추론 통계로서 데이터의 주어진 기능의 상태는 사용 목적에 달려 있습니다.

그러나 일부 통계는 데이터의 관련 기능을 설명하는 데 더 유용하며 일부는 추론을 돕기에 적합합니다.

  • 추론 통계 : 귀무 가설이 거짓 인 주어진 데이터 생성 프로세스에 대해 t 및 z와 같은 표준 테스트 통계는 예상 값이 샘플 크기에 크게 영향을받습니다. 대부분의 연구자들은 본질적 관심의 모집단 모수를 추정하는 것과 같은 통계를 보지 못할 것입니다.
  • 기술 통계량 : 기술 통계량은 대조적으로 본질적인 관심이있는 모집단 모수를 추정합니다. 예를 들어 표본 평균 및 표준 편차는 등가 모집단 모수의 추정치를 제공합니다. 최소 및 최대와 같은 설명 통계조차도 동등하거나 유사한 모집단 모수에 대한 정보를 제공하지만이 경우에는 훨씬 더 많은주의가 필요합니다. 더욱이, 많은 기술 통계량은 편향적이거나 그렇지 않은 이상적 추정량보다 적을 수있다. 그러나 여전히 관심 모집단 모수를 추정하는 데 약간의 유용성이 있습니다.

따라서 이러한 관점에서 이해해야 할 중요한 사항은 다음과 같습니다.

  • 통계량 : 표본 데이터의 기능
  • 매개 변수 : 모집단 기능 (데이터 생성 프로세스)
  • 추정기 : 모수 의 추정치를 제공하는 데 사용되는 샘플 데이터의 함수
  • 추론 : 모수에 대한 결론에 도달하는 과정

따라서 통계를 사용하여 연구원의 의도에 따라 설명과 추론의 구별을 정의하거나 일반적으로 사용되는 방법에 따라 통계를 정의 할 수 있습니다.


t 또는 F 점수 (예 : t- 테스트가 아닌 )의 추론 통계 를 호출하는 것이 어떻게 정당화 됩니까?
jona

@jona t- 점수는 t- 검정에 사용되는 "통계"이므로 이러한 추론 프로세스의 일부로 사용될 때 t- 점수를 추론 통계로 설명 할 수 있습니다. 통계가 데이터의 함수라는 가정으로 시작한 것 같습니다. 그러나 아마도 추론에 사용되는 광범위한 기술 세트로 추론 통계를 자주 생각한다고 주장 할 수 있습니까?
Jeromy Anglim

다른 말로 표현해 보겠습니다. t- 통계가 p- 값과 같은 추론 적 진술이 아니라 표본에 대한 설명이 아닙니까?
jona

예, 데이터의 기능은 샘플에 대한 설명과 같습니다. 나는 그러한 통계가 추론 적 과정에서 사용된다고 생각하고 있다고 생각한다. 나는 종종 교과서가이 예제들을 사용하는 것을 보았다. 그러나 p- 값과 이진 추론 자체가 통계 (예 : 샘플 데이터의 기능)로 볼 수 있다고 가정합니다. 그리고 이진 추론 자체는 그 추론에 가장 명확하게 정렬 된 것으로 볼 수 있습니다. 그게 당신이 얻는 것입니까?
Jeromy Anglim

1
예를 들어 데이터를 사용하여 분포와 관련된 t 에 도달 하면 p 가 주어지고 모수 매개 변수에 대한 이진 추론이 생성됩니다. 따라서 빈번한 관점에서 t, p 및 이진 추론은 모두 임의의 변수입니다. 모두 추론 과정에 관여했다. 장단점과 같은 통계의 전부 또는 일부만을 표시하는 장단점이 무엇인지 잘 모르겠습니다.
Jeromy Anglim

8

추론의 한 형태는 실험 처리의 무작위 할당을 기반으로하며, 모집단의 무작위 샘플링이 아니라 (가설 적으로도)입니다. Oscar Kempthorne 은 지지자였습니다.

ABtt10/252=0.04

예측은 인구에 대한 제안을 반드시 작성하지 않아도되는 또 다른 영역입니다. (모두가 예측을 "추론"이라고 부르고 싶지는 않지만 Geisser (1993), Predictive Inference : An Introduction )이 있습니다. 종종 적합한 모집단 모형에서 예측이 이루어 지지만 항상 그런 것은 아닙니다. 예 : @Matt의 분류 예제, 모델 평균화 (Bayesian 또는 Akaike 가중치 기반) 또는 지수 평활과 같은 예측 알고리즘.

NB "추론과 기술 통계"는 표본에서 계산 된 수량이 아니라 징계 통계를 더 자주 참조한다고 생각합니다. 추론 통계와 기술 통계 사이에는 본질적인 차이가 없습니다. @Jeremy가 지적했듯이, 어떤 용도로 사용 하느냐의 문제입니다.


2

분류가 데이터 점이 그려지는 모집단에 대해 반드시 진술해야한다고 확신하지 않습니다. 아시다시피 분류는 각각 특정 클래스로 레이블이 지정된 일부 "기능"벡터로 구성된 학습 데이터를 사용하여 레이블이없는 다른 피쳐 벡터에 속하는 클래스 레이블을 예측합니다. 예를 들어, 환자의 활력 징후와 의사의 진단을 사용하여 다른 환자의 건강 여부를 예측할 수 있습니다.

P(class=c|features)c

그러나 다른 분류자는 클래스 자체를 모델링하지 않고 클래스 간의 차이점을 찾습니다. 이를 차별 분류기라고합니다. 가장 가까운 이웃 분류기는 가장 가까운 이웃 분류기입니다.이 분류기는 레이블이없는 예제를 가장 가까운 이웃의 클래스에 할당합니다 (클로즈는 문제에 대한 합리적인 방식으로 정의 됨). 데이터 포인트가 그려진 인구에 대한 많은 정보가 포함되어있는 것처럼 보이지 않습니다.

t


0

한 줄로, 데이터가 주어지면 기술 통계는 사용하는 측정에 따라 최소한의 정보 손실로 데이터의 내용을 요약하려고 시도합니다. 데이터의 지리를 볼 수 있습니다. (클래스의 성과 그래프를보고 누가 맨 위, 맨 아래 등을 말합니다)

한 줄로, 데이터가 주어지면 데이터가 나오는 가상 모집단의 속성을 추정하고 추론하려고합니다. (예를 들어, 기초 인구가 전체적으로 고려할 수 없을 정도로 크다고 가정 할 때 클래스의 좋은 샘플을 통해 7 학년 학생들을 이해하는 것)


3
나는 그것이 정보의 최소 손실을 목표로하는 기술 통계의 정의 또는 특성이라고 생각하지 않습니다. 정말 중요한 세부 사항을 생략하고 종종 문제가되는 설명 통계를 가질 수 있습니다.
Nick Cox

0

한마디로

기술 통계량 은 의미있는 데이터를 설명, 표시 또는 요약하는 데이터 분석입니다. 전체 인구에 대한 데이터 / 토크를 설명하는 방법 일뿐입니다. 그들 중 일부는 중심 경향의 측정 및 분산 측정입니다

추론 통계 는 표본을 사용하여 표본이 추출 된 모집단에 대한 일반화를 수행 할 수있는 기술입니다.


0

기술 통계량은 의미있는 데이터를 기술, 표시 또는 요약하는 데이터 분석입니다. 전체 인구에 대한 데이터 / 토크를 설명하는 방법 일뿐입니다. 그들 중 일부는 중심 경향의 측정 및 분산 측정입니다

추론 통계는 표본을 사용하여 표본을 추출한 모집단에 대한 일반화를 수행 할 수있는 기술입니다.


Cross Validated에 오신 것을 환영 합니다 ! 둘러 보기를 잠시보십시오 . 좋은 답변을 마치려고했지만 문제가 발생한 것 같습니다. 생각을 완성하기 위해 답을 자유롭게 편집하십시오. 여기에 넣은 내용을 공동으로 인용하는 인용 / 참조를 추가하여 답변을 개선 할 수도 있습니다. 또한 "인구에 대해 제안하지 않는 추론 통계의 예가 있습니까?"라는 질문에 대답해야합니다.
Tavrock
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.