배경 :
통계의 절대 초보자 인 고객 (일부 변호사)에 대한 데이터 분석을 수행해야했습니다. 그는 "통계적 유의성"이라는 용어의 의미를 물었고 실제로 설명하려고 노력했지만 ... 실패한 점을 잘 설명하지 못했기 때문에;)
배경 :
통계의 절대 초보자 인 고객 (일부 변호사)에 대한 데이터 분석을 수행해야했습니다. 그는 "통계적 유의성"이라는 용어의 의미를 물었고 실제로 설명하려고 노력했지만 ... 실패한 점을 잘 설명하지 못했기 때문에;)
답변:
차이는 우연의 결과로 발생합니다.
통계적으로 유의 한 것이 있다고 생각 될 때 차이가 합리적으로 설명 될 수있는 것보다 더 크다고 생각합니다.
참고 :이 답변에서 강조하고 싶은 것은 통계적 유의성이 유용한 도구이지만 사실과 다릅니다.
52 장의 팩을 가져 가십시오. 내 고객이 결백하다면 보통 13 장의 카드 팩입니다. 내 고객이 거짓말을하고 있다면 고정 팩이며 52 장의 카드가 모두 마음입니다.
나는 첫 번째 카드를 그리고 그것은 마음입니다. 아하, 유죄! 분명히 상식은 그렇지 않다고 알려줍니다. 비록 그가 결백 할지라도 이런 일이 일어날 확률은 4 분의 1에 달했습니다. 우리는 하나의 카드를 보는 것만으로 통계적 의미 가 없습니다 .
그래서 우리는 두 번째 카드를 그립니다. 또 다른 마음. 흠 ... 그럼 분명히 유죄입니다! 남은 51 장의 카드에는 여전히 12 개의 하트가 있었으므로 불가능하지는 않았습니다. 수학 (13/52 * 12/51 = 0.0588)은 무해하더라도 시간의 약 6 %가 발생한다고 알려줍니다. 대부분의 과학자들에게 이것은 여전히 중요하지 않습니다.
세 번째 카드, 다른 마음을 뽑으십시오! 3 열. 이 일이 발생할 확률은 (13/52 * 12/51 * 11/50 = 0.01294)이므로 우연히 발생할 수있는 시간의 1 % 이상입니다.
많은 과학 분야에서 5 %가 컷오프 지점으로 사용됩니다. 당신이 그 3 장의 카드 이외의 다른 증거가 없다면 당신은 그가 유죄라는 통계적으로 유의미한 결과를 얻습니다.
중요한 점은 자신의 죄책감에 대한 신뢰를 더 잘 볼 수있는 카드가 많을수록 통계적 중요성이 높아진다는 또 다른 방법입니다.
참고 : 14 장의 카드를 볼 수 없다면 자신의 죄 의 증거 는 없습니다. 일반적인 카드 팩에서는 이론적으로 13 개의 하트를 연속으로 그릴 수 있지만 14 개는 불가능합니다. [어린이를 제외하고 : 카드의 숫자가 보이지 않는다고 가정하자. 모든 카드는 가능한 네 가지 정장 중 하나입니다.]
참고 : 심장 이외의 카드를 뽑는 순간 그의 결백 을 증명할 수 있습니다 . 이것은 정상 또는 모든 심장의 두 가지 가능한 팩이 있었기 때문입니다. 실제 생활은 더 복잡해지고 수학도 더 복잡해집니다.
그건 그렇고, 클라이언트가 카드 플레이어가 아닌 경우 독점을 시도하십시오. 모든 사람들이 때때로 6 배를 굴립니다. 하지만 의심 할 때마다 누군가가 6 배를 굴린다면 통계는 단지 우리가 얼마나 의심 스러워야 하는지를 정확히 알려줍니다.
내 자신의 조언은 다음 사항에 대해 이야기 하지 않는 것입니다.
변호사에 대해 너무 열심히하지 마십시오. 이것은 적어도 한 학기를 대학 통계 수업에서 보냈으며 그중 일부는 그를 고수하지 않았습니다. 제가 작업 한 거의 모든 비과학가들에 대해서도 같은 이야기입니다 . 통계적 중요성은 그대로 유지되지 않습니다 . 너무 부 자연스러운 개념입니다.
증거의 관점에서 통계적 의의를 설명 할 것을 권한다 . 고전 통계 학자들은 0에서 1까지의 척도로 증거를 인코딩했습니다. 작은 값은 더 많은 증거를 구성하고 0.05는 선이 일반적으로 그려지는 곳입니다.
"통계적으로 유의미 함"은 무언가가 무작위로 발생했을 수 있지만 가능성은 낮다는 것을 의미합니다. 대신 어떤 종류의 원인이있을 가능성이 훨씬 더 높습니다. 설명이 너무 추상적이기 때문에 고객과 관련된 예를 사용하여이를보다 구체적으로 만들어야합니다.
예를 들어, 변호사 Anne이 Bill보다 평균적으로 더 많은 소송에서 이겼다면 이는 무작위로 발생했을 수 있습니다. 그러나 Anne이 통계적으로 더 많은 사례를 얻은 경우 Anne이 Bill보다 많은 사례를 얻은 이유를 설명하는 데 도움이 될 가능성이 훨씬 더 높습니다. 우리는 원인을 모른다. 아마도 Anne은 더 나은 변호사이거나 Bill은 의도적으로 더 어려운 사건을 선택합니다.
간단하고 간결하게 유지하십시오!
p- 값은 null을 참이라고 가정 한 결과보다 더 극단적 인 결과를 얻을 확률로 정의됩니다. p- 값이 충분히 작 으면 널이 아닐 수 있습니다. 우리는 "충분히 작은"(알파)이라고 생각하는 것에 대한 컷오프를 임의로 선택하고 알파 아래로 떨어지는 모든 p- 값에 대해서는 널을 거부합니다.
그것이 내가 인트로 통계 수업에 설명하는 방법입니다.
노력하겠습니다.
먼저 평균 데이터와 데이터가 얼마나 다양한 지에 따라 p- 값을 계산합니다. 변수가 많을수록 작은 p- 값을 얻을 가능성이 적습니다. 반면에 예를 들어 두 그룹을 비교하는 경우 평균 간의 차이가 클수록 p- 값이 작아집니다.
또한 더 많은 데이터를 가짐으로써 데이터의 가변성을 다소 상쇄 할 수 있습니다. 두 평균과 같은 양의 변동성에서 동일한 차이로 두 데이터 집합을 이미징합니다. 이 경우 표본 크기가 더 큰 세트의 p- 값이 더 작습니다.
테스트 부분은 p- 값이 일부 숫자보다 작은 지 확인합니다. 일반적으로 사람들은 .05를 사용하지만 이것은 임의의 사회적 관습입니다. 많은 사람들이 임의의 숫자를 사용하는 것이 의미가 없다고 생각하지만 역사적 이유로 매우 일반적입니다.
또한 유의성 검정에서 두 그룹간에 차이가 있다고해서 왜 그 차이가 있는지 아는 것은 아닙니다. 반면에 검정에 유의 한 차이가 없다고 표시되면 변동성이 너무 커서 낮은 p 값을 얻기에 충분한 데이터가 없기 때문에 실제 차이가 없다는 의미는 아닙니다.
편집하다:
요약하면 p 값이 낮을수록 예측에 대한 더 많은 증거가 있음을 의미합니다.
예측 결과와의 차이-> p- 값 하강
더 많은 데이터-> 다운 p- 값
추가 변동성-> p- 값 상승
다운 p- 값은 예측이 거짓이라는 더 많은 증거를 의미합니다. 역사의 모든 예측은 소수점 이하 자릿수로 잘못 표시되었습니다.
통계적 유의성은 주어진 가설을 수용하거나 거부하기위한 정당성을 제공하는 데 사용되는 개념입니다. 데이터 세트가 주어지면 분석가는 통계를 계산하고 다른 변수 사이의 다양한 관계의 크기를 결정할 수 있습니다.
통계의 역할은 변수간에 관측 된 계산 된 통계 또는 관계가 실제 진술로 해석 될 수 있거나 표본 데이터에서 관측 된 결과가 단순히 우연에 의한 것인지 결론을 내릴 수있는 충분한 증거가 데이터에 포함되어 있는지 확인하는 것입니다. 이는 귀무 가설이 참이지만 귀무 가설이 거짓이 아닌 경우 특정 특성을 나타내는 일부 표본 통계량을 결정하여 수행됩니다. 관련 표본 통계량이 귀무 가설 하에서 예상되는 특성을 나타낼수록 귀무 가설이 정확하다는 통계적 증거가 강해집니다. 마찬가지로 표본 통계량이 귀무 가설 하에서 예상되는 특성을 나타내지 않을수록 귀무 가설이 정확하다는 통계적 증거는 더 약합니다.
표본 통계량에서 귀무 하에서 예상되는 특성을 나타내는 양은 정도이지만 귀무 가설이 수락되거나 거부된다는 결론을 내리려면 임의의 컷오프가 있어야합니다. 따라서 컷오프 값이 선택됩니다. 표본 통계량이 컷오프 값의 한쪽에 있거나 해당 값에 해당하는 경우 귀무 가설 하에서 예상되는 특성과 일치한다고하며, 결과는 주어진 컷오프 값에 대해 통계적으로 유의 한 것으로 간주 될 수 있습니다 (예 : 5 % 알파) 수평). 관련 표본 통계량이 컷오프 값의 다른쪽에 해당되면 귀무 가설 하에서 예상되는 특성과 일치하지 않는 것으로 간주되므로 결과는 주어진 컷오프 값에 대해 통계적으로 유의하지 않은 것으로 간주됩니다.