통계적 배경이없는 사람들에게 통계적 중요성을 어떻게 설명 하시겠습니까?

11

배경 :
통계의 절대 초보자 인 고객 (일부 변호사)에 대한 데이터 분석을 수행해야했습니다. 그는 "통계적 유의성"이라는 용어의 의미를 물었고 실제로 설명하려고 노력했지만 ... 실패한 점을 잘 설명하지 못했기 때문에;)

statistical-significance inference communication

— Daniel Ryback
소스

15

차이는 우연의 결과로 발생합니다.

통계적으로 유의 한 것이 있다고 생각 될 때 차이가 합리적으로 설명 될 수있는 것보다 더 크다고 생각합니다.

— 찰스
소스

나는 기회의 사용을 좋아하지만, 유의성 테스트가 일반적으로 사용되는 방식에있어서 매우 오도되는 것으로 생각합니다. 예를 들어, 표본 크기가 크면 "기회"기준선 차이로 인해 거의 항상 유의미 함을 얻게됩니다. 이러한 결과는 우연히 설명 되었음에도 불구하고 "통계적으로 유의미"하다고 할 수 있습니다.

— 플라스크

@Flask : 우연으로 인한 이러한 기준 차이는 어떤 의미입니까?

— Scortchi-Monica Monica 복원

@Scortchi 무작위 추출이 수행 된 경우 차이가 우연 일 수 있습니다. 여기를 참조하십시오 . 그것이 수행되었다하더라도 나중에 무언가가 편향 될 수 있습니다. 여기를 참조하십시오 . 무작위 화가 수행되지 않은 경우, 우연 또는 조사자 편견 또는 여러 가지 이유 때문일 수 있습니다.

— 플라스크

1

차이점 테스트에만 적용된다는 점을 제외하고 유용한 답변입니다.

— rolando2

2

+1 이것은 p- 값, 확률, 분포, 귀무 가설 등의 아크 나를 피하고 대부분의 변호사가 다루는 것에 적용 할 수있는 방식으로 지점에 도달하기 때문에 훌륭한 답변입니다. 포괄적이지 않을 수도 있다는 점이 중요합니다. 세부 사항 및 변형은 나중에 처리 할 수 있습니다. 이것을 개선하기 위해 압력을가한다면, 통계적 중요성에 대한 신념이 데이터에 근거한다는 점을 강조하는 것이 중요하다 . 이것은 신학 적 신념과이 설명을 구별 할 것이다.

— whuber

3

참고 :이 답변에서 강조하고 싶은 것은 통계적 유의성이 유용한 도구이지만 사실과 다릅니다.

52 장의 팩을 가져 가십시오. 내 고객이 결백하다면 보통 13 장의 카드 팩입니다. 내 고객이 거짓말을하고 있다면 고정 팩이며 52 장의 카드가 모두 마음입니다.

나는 첫 번째 카드를 그리고 그것은 마음입니다. 아하, 유죄! 분명히 상식은 그렇지 않다고 알려줍니다. 비록 그가 결백 할지라도 이런 일이 일어날 확률은 4 분의 1에 달했습니다. 우리는 하나의 카드를 보는 것만으로 통계적 의미 가 없습니다 .

그래서 우리는 두 번째 카드를 그립니다. 또 다른 마음. 흠 ... 그럼 분명히 유죄입니다! 남은 51 장의 카드에는 여전히 12 개의 하트가 있었으므로 불가능하지는 않았습니다. 수학 (13/52 * 12/51 = 0.0588)은 무해하더라도 시간의 약 6 %가 발생한다고 알려줍니다. 대부분의 과학자들에게 이것은 여전히 중요하지 않습니다.

세 번째 카드, 다른 마음을 뽑으십시오! 3 열. 이 일이 발생할 확률은 (13/52 * 12/51 * 11/50 = 0.01294)이므로 우연히 발생할 수있는 시간의 1 % 이상입니다.

많은 과학 분야에서 5 %가 컷오프 지점으로 사용됩니다. 당신이 그 3 장의 카드 이외의 다른 증거가 없다면 당신은 그가 유죄라는 통계적으로 유의미한 결과를 얻습니다.

중요한 점은 자신의 죄책감에 대한 신뢰를 더 잘 볼 수있는 카드가 많을수록 통계적 중요성이 높아진다는 또 다른 방법입니다.

참고 : 14 장의 카드를 볼 수 없다면 자신의 죄 의 증거 는 없습니다. 일반적인 카드 팩에서는 이론적으로 13 개의 하트를 연속으로 그릴 수 있지만 14 개는 불가능합니다. [어린이를 제외하고 : 카드의 숫자가 보이지 않는다고 가정하자. 모든 카드는 가능한 네 가지 정장 중 하나입니다.]

참고 : 심장 이외의 카드를 뽑는 순간 그의 결백 을 증명할 수 있습니다 . 이것은 정상 또는 모든 심장의 두 가지 가능한 팩이 있었기 때문입니다. 실제 생활은 더 복잡해지고 수학도 더 복잡해집니다.

그건 그렇고, 클라이언트가 카드 플레이어가 아닌 경우 독점을 시도하십시오. 모든 사람들이 때때로 6 배를 굴립니다. 하지만 의심 할 때마다 누군가가 6 배를 굴린다면 통계는 단지 우리가 얼마나 의심 스러워야 하는지를 정확히 알려줍니다.

— 대런 쿡
소스

3

내 자신의 조언은 다음 사항에 대해 이야기 하지 않는 것입니다.

p- 값
테스트 통계
우연히 일어날 일의 가능성.

변호사에 대해 너무 열심히하지 마십시오. 이것은 적어도 한 학기를 대학 통계 수업에서 보냈으며 그중 일부는 그를 고수하지 않았습니다. 제가 작업 한 거의 모든 비과학가들에 대해서도 같은 이야기입니다 . 통계적 중요성은 그대로 유지되지 않습니다 . 너무 부 자연스러운 개념입니다.

증거의 관점에서 통계적 의의를 설명 할 것을 권한다 . 고전 통계 학자들은 0에서 1까지의 척도로 증거를 인코딩했습니다. 작은 값은 더 많은 증거를 구성하고 0.05는 선이 일반적으로 그려지는 곳입니다.

— 벤오고 렉
소스

imo sig의 아이디어. 비 과학자를 고수 할 수있다. 사람들이 그렇게 멀다면 종종 부 자연스러운 것으로 여겨지는 것은 기술적 정의입니다. 물론 증거에 관한 한 이것은 증거에 관한 것입니다. 문제는 시그에 대한 결정에 도달하기 위해 통계적으로 증거를 다루는 방법입니다.

— rolando2

나는 당신의 낙관론을 좋아하지만 통계적 중요성이 모든 증거에 관한 것이라는 것이 일반적인 사람에게는 명백하지 않다. 데이터 세트가 충분히 커지고 계산 된 모든 숫자가 어떻게 든 "유효"할 때 전환에서 일종의 스위치로 본다고 생각합니다. 당신은 평신도가 증거의 정량화 방법을 아는 것이 중요하다고 주장하므로, 처음에는 사실이 아니라고 생각한 가설에 따라 계산 된 확률에 대해 이야기 할 준비를하십시오.

— Ben Ogorek

아 그러나 증거에 대해 이야기하면 베이지안 땅에 들어갑니다.

— Arthur B.

1

나는 베이지안이 자신의 "증거"(개념)를 소유하고 있다고 생각하지는 않는다. 작은 p- 값이 무언가의 증거라고 주장합니다.

— Ben Ogorek

1

"통계적으로 유의미 함"은 무언가가 무작위로 발생했을 수 있지만 가능성은 낮다는 것을 의미합니다. 대신 어떤 종류의 원인이있을 가능성이 훨씬 더 높습니다. 설명이 너무 추상적이기 때문에 고객과 관련된 예를 사용하여이를보다 구체적으로 만들어야합니다.

예를 들어, 변호사 Anne이 Bill보다 평균적으로 더 많은 소송에서 이겼다면 이는 무작위로 발생했을 수 있습니다. 그러나 Anne이 통계적으로 더 많은 사례를 얻은 경우 Anne이 Bill보다 많은 사례를 얻은 이유를 설명하는 데 도움이 될 가능성이 훨씬 더 높습니다. 우리는 원인을 모른다. 아마도 Anne은 더 나은 변호사이거나 Bill은 의도적으로 더 어려운 사건을 선택합니다.

— 홍옥
소스

0

간단하고 간결하게 유지하십시오!

p- 값은 null을 참이라고 가정 한 결과보다 더 극단적 인 결과를 얻을 확률로 정의됩니다. p- 값이 충분히 작 으면 널이 아닐 수 있습니다. 우리는 "충분히 작은"(알파)이라고 생각하는 것에 대한 컷오프를 임의로 선택하고 알파 아래로 떨어지는 모든 p- 값에 대해서는 널을 거부합니다.

그것이 내가 인트로 통계 수업에 설명하는 방법입니다.

— TrynnaDoStat
소스

그러나 당신이 그럴듯한 귀무 가설을 고를 방법이 없다면 (즉, 두 그룹의 사람들이 정확히 동일하지는 않지만, mean1 = mean2보다 더 나은 것을 예측하기에 충분한 정보가없는 경우) 어떻게해야합니까? 한계를 언급하지 않고 통계적 중요성을 설명하면 해를 끼칠 수 있습니다.

— 플라스크

0

노력하겠습니다.

먼저 평균 데이터와 데이터가 얼마나 다양한 지에 따라 p- 값을 계산합니다. 변수가 많을수록 작은 p- 값을 얻을 가능성이 적습니다. 반면에 예를 들어 두 그룹을 비교하는 경우 평균 간의 차이가 클수록 p- 값이 작아집니다.

또한 더 많은 데이터를 가짐으로써 데이터의 가변성을 다소 상쇄 할 수 있습니다. 두 평균과 같은 양의 변동성에서 동일한 차이로 두 데이터 집합을 이미징합니다. 이 경우 표본 크기가 더 큰 세트의 p- 값이 더 작습니다.

테스트 부분은 p- 값이 일부 숫자보다 작은 지 확인합니다. 일반적으로 사람들은 .05를 사용하지만 이것은 임의의 사회적 관습입니다. 많은 사람들이 임의의 숫자를 사용하는 것이 의미가 없다고 생각하지만 역사적 이유로 매우 일반적입니다.

또한 유의성 검정에서 두 그룹간에 차이가 있다고해서 왜 그 차이가 있는지 아는 것은 아닙니다. 반면에 검정에 유의 한 차이가 없다고 표시되면 변동성이 너무 커서 낮은 p 값을 얻기에 충분한 데이터가 없기 때문에 실제 차이가 없다는 의미는 아닙니다.

편집하다:

요약하면 p 값이 낮을수록 예측에 대한 더 많은 증거가 있음을 의미합니다.

예측 결과와의 차이-> p- 값 하강

더 많은 데이터-> 다운 p- 값

추가 변동성-> p- 값 상승

다운 p- 값은 예측이 거짓이라는 더 많은 증거를 의미합니다. 역사의 모든 예측은 소수점 이하 자릿수로 잘못 표시되었습니다.

— 플라스크
소스

0

통계적 유의성은 주어진 가설을 수용하거나 거부하기위한 정당성을 제공하는 데 사용되는 개념입니다. 데이터 세트가 주어지면 분석가는 통계를 계산하고 다른 변수 사이의 다양한 관계의 크기를 결정할 수 있습니다.

통계의 역할은 변수간에 관측 된 계산 된 통계 또는 관계가 실제 진술로 해석 될 수 있거나 표본 데이터에서 관측 된 결과가 단순히 우연에 의한 것인지 결론을 내릴 수있는 충분한 증거가 데이터에 포함되어 있는지 확인하는 것입니다. 이는 귀무 가설이 참이지만 귀무 가설이 거짓이 아닌 경우 특정 특성을 나타내는 일부 표본 통계량을 결정하여 수행됩니다. 관련 표본 통계량이 귀무 가설 하에서 예상되는 특성을 나타낼수록 귀무 가설이 정확하다는 통계적 증거가 강해집니다. 마찬가지로 표본 통계량이 귀무 가설 하에서 예상되는 특성을 나타내지 않을수록 귀무 가설이 정확하다는 통계적 증거는 더 약합니다.

표본 통계량에서 귀무 하에서 예상되는 특성을 나타내는 양은 정도이지만 귀무 가설이 수락되거나 거부된다는 결론을 내리려면 임의의 컷오프가 있어야합니다. 따라서 컷오프 값이 선택됩니다. 표본 통계량이 컷오프 값의 한쪽에 있거나 해당 값에 해당하는 경우 귀무 가설 하에서 예상되는 특성과 일치한다고하며, 결과는 주어진 컷오프 값에 대해 통계적으로 유의 한 것으로 간주 될 수 있습니다 (예 : 5 % 알파) 수평). 관련 표본 통계량이 컷오프 값의 다른쪽에 해당되면 귀무 가설 하에서 예상되는 특성과 일치하지 않는 것으로 간주되므로 결과는 주어진 컷오프 값에 대해 통계적으로 유의하지 않은 것으로 간주됩니다.

— tjnel
소스

그러나 얼마나 자주이 정말 뚜렷한 인구가 결과에 적용되어 있는지 사전에 결정했다. 일반적으로 연구 된 정확한 모집단을 넘어서 결과를 적용한다는 주장이 이루어지며, 이는 독특한 표본이었습니다. 많은 상황에서 주제의 고유성 / 무엇이 중요하지 않은지 알 수 있습니다. 제조 품질 관리 는 예외 일 수 있지만, 유의성 테스트는 그보다 훨씬 광범위하게 사용됩니다. 나는 단지 자신의 교육에서 생략 된 절차의 한계를 강조하는 것을 의미합니다.

— 플라스크

@Flask 좋은 지적입니다. 더 일반적인 답변을 위해 답변을 수정했습니다.

— tjnel