누군가 기본적인 통계 로 충분한 통계 를 설명해 주 시겠습니까? 나는 공학적 배경에서 왔으며 많은 것을 겪었지만 직관적 인 설명을 찾지 못했습니다.
누군가 기본적인 통계 로 충분한 통계 를 설명해 주 시겠습니까? 나는 공학적 배경에서 왔으며 많은 것을 겪었지만 직관적 인 설명을 찾지 못했습니다.
답변:
충분한 통계는 샘플에 포함 된 모든 정보를 요약하여 샘플을 제공했는지 또는 통계 자체를 제공했는지에 관계없이 동일한 모수 추정치를 작성합니다. 정보 손실없이 데이터를 줄입니다.
한 가지 예가 있습니다. 의 대칭 분포가 0 이라고 가정 합니다. 샘플을 제공하는 대신 절대 값 샘플을 대신 전달합니다 (통계량). 당신은 표시를 볼 수 없습니다. 그러나 분포가 대칭이므로 주어진 값 , 및 가 똑같이 가능성이 있습니다 (조건부 확률은 ). 따라서 공정한 동전을 뒤집을 수 있습니다. 머리가 나오면 음수로 만드십시오 . 꼬리가 있으면 긍정적으로 만드십시오. 이것은 의 표본을 제공 하는데, 이는 원본 데이터 와 동일한 분포를 갖습니다 . 기본적으로 통계에서 데이터를 재구성 할 수있었습니다. 그것이 충분하게 만드는 것입니다.x - x x 0.5 x X ' X
당신이 동전을 가지고 있고 그것이 공평인지 아닌지 모른다고 가정하십시오. 다시 말해, 머리 가 올 확률 p ( )와 꼬리가 올 ( )이며 의 값을 모릅니다 .
동전을 여러 번 던져서 의 가치에 대한 아이디어를 얻으려고 시도하십시오 ( 예 : 번).
라고 가정 하면 결과는 시퀀스 입니다.
이제 당신은 통계학자가 당신을 위해 의 가치를 추정 하고 동전이 공정한지 아닌지를 알려줄 것입니다. 그들이 계산을하고 결론을 내릴 수 있도록 어떤 정보를 알려 주어야합니까?
그들에게 모든 데이터, 즉 말할 수 있습니다 . 그래도 이것이 필요합니까? 관련 정보를 잃지 않고이 데이터를 요약 할 수 있습니까?
각 동전 던지기에 대해 동일한 작업을 수행하고 동전 던지기가 서로 영향을 미치지 않았기 때문에 동전 던지기의 순서는 관련이 없음이 분명합니다. 예를 들어 결과가 경우 결론은 달라지지 않습니다. 통계 친구에게 실제로 말해야 할 것은 머리 수의 수입니다.
헤드 수는 p에 대한 충분한 통계량 이라고 말 함으로써 이를 표현합니다 .
이 예제는 개념의 풍미를 제공합니다. 공식적인 정의와 어떻게 연결되는지 확인하려면 계속 읽으십시오.
공식적으로 통계의 값이 주어지면 결과의 확률 분포에 모수가 포함되지 않으면 모수가 통계에 충분합니다.
이 예에서 헤드 수를 알기 전에 모든 결과의 확률은 . 분명히 이것은 달려 있습니다 .
그러나 우리가 헤드 수가 3 (또는 다른 값)임을 알면 3 헤드 ( , 가 나타납니다 )이다 똑같이 가능성 (그들은 모두 가능성이 그래서 열 가능성이있는 사실 ). 따라서 분포는 더 이상 와 관련이 없습니다 . 직관적으로 이것은 우리가 관찰 한 특정 결과가 p 에 대해 더 이상 정보를 제공하지 않음을 의미합니다결과는 영향을받지 않기 때문 입니다.
여담, 확률 우리가 알기도 전에 참고 헤드의 수는 단지에 따라 달라 관통 . 이것은 p 에 충분한 와 같습니다 .