귀무 가설을 기각하기에 p- 값이 0.04993입니까?

Wilcoxon 부호있는 순위 통계적 유의성 검정에서 값이 일부 데이터를 . 의 임계 값으로 ,이 결과는 귀무 가설을 기각하기에 충분 합니까 , 또는 p- 값을 소수점 이하 3 자리로 반올림하면 이되기 때문에 검정이 결정적이지 않다고 말하는 것이 더 안전 합니까? $p$ $0.04993$ $p < 0.05$ $0.050$

hypothesis-testing statistical-significance p-value

— 이슬람 엘나 바로이
소스

0.04993 <0.05이므로 더 낮습니다. P- 값을 소수점 이하 몇 자리까지 신뢰할 수 없다는 본능은 좋지만 프로그램에서 0.05보다 작 으면 사람들은 일반적으로 전달 된 것으로 간주합니다. 여기서 실제 문제는 <0.05는 "실제", "게시 가능", "행복에 대한 원인"을 의미하고 반대의 의미는 "불법", "게시 불가", "비참에 대한 원인"을 의미하는 고정 레벨 유의성 테스트의 주물입니다. . 통계에 관한 가장 좋은 입문서는 이것을 어느 정도 논의합니다. 좋은 예는 Freedman, Pisani, Purves, Statistics 입니다. 뉴욕 : WW Norton, 모든 버전.

— Nick Cox

p- 값이 0.051이면 어떤 결정을 내릴 것인지 스스로에게 물어봐야합니까? 0.049이면 어떻게 되나요? 다른 결정을 내리시겠습니까? 왜?

— AlefSin 2016 년

귀하의 의견에 감사드립니다. 우리의 경우에 우리는 자료가 출판 가능한지 아닌지를 숙고하지 않고있다. 우리는 단순히이 결과의 통계적 중요성에 대해 논문에서 진술하는 것을 고려하고 있으며, 우리의 진술이 부정확하거나 부정확하지 않은지 확인하고 싶다 .

— 이슬람 엘-나바 로비

보고 P = 0.04993이 떠 오릅니다. 리뷰어 또는 에디터의 의견을 예측하기는 어렵습니다. 반올림하려면 일관된 반올림 규칙을 지정하는 것이 항상 좋은 생각이며 널리 받아 들여집니다. 어떤 사람들은 3dp로 반올림하고 일종의 주연 규칙을 사용할 수 있으므로 0.050 (3dp)를보고하고 <0.05로 주연하는 것이 일정합니다.

— Nick Cox

어쩌면 ... 우리는 이중 부트 스트랩을 실행하고

값에 대한 신뢰 구간을 계산해야합니다 ! 솔직히, 나는보고 할 것입니다 : "이번 연구 결과는 경계 중요한이었다

." 그 시점에서, 당신은 머리카락을 쪼개고 있으며, 모든 사람들은 과학을 달리기위한 1/20 확률의 오 탐지가 완전히 임의의 방법이라는 것을 갑자기 기억합니다.

p

$p$

0.049 < p < 0.050

$0.049 < p < 0.050$

— AdamO

답변:

여기에는 두 가지 문제가 있습니다.

1) 공식 가설 테스트를 수행하는 경우 (그리고 이미 내 책에서 p- 값을 인용하는 한) 공식 거부 규칙은 무엇입니까?

테스트 통계를 임계 값과 비교할 때 임계 값은 기각 영역에 있습니다. 이 형식은 모든 것이 연속적 일 때는 중요하지 않지만 테스트 통계의 분포가 불연속적인 경우에는 중요합니다.

이에 따라 p- 값과 유의 수준을 비교할 때 규칙은 다음과 같습니다.

경우 거부 $p\leq\alpha$

p- 값을 0.05로 올림하더라도 실제로 $p$ 값이 정확히 0.05 인 경우에도 공식적으로 거부해야합니다 .

2) '우리의 p- 값은 우리에게 무엇을 말합니까?'라는 관점에서 p- 값을 '널에 대한 증거'로 해석 할 수 있다고 가정하면 (그에 대한 의견이 다소 나뉘어져 있다고 말하자) 0.0499와 0.0501은 그렇지 않습니다 실제로 데이터에 대해 다른 것을 말하십시오 (효과 크기는 거의 같은 경향이 있습니다).

나의 제안은 (1) null을 공식적으로 거부하고, 그것이 정확히 0.05 인 경우에도 여전히 거부되어야한다고 지적 할 것이다. (2) 에 대해 특별히 특별한 것은 없으며 경계선에 매우 가깝습니다. 심각 임계 값이 약간 작더라도 거부로 이어지지 않습니다. $\alpha = 0.05$

— Glen_b-복귀 모니카
소스

그러나 다시, 매우 유사한 인수를 사용하여 널을 거부하지 않을 수 있습니다. 0.05에 대해 특별한 것은 없습니다. 0.06을 제한으로 선택했다면 아마도 질문하지 않을 것입니다. 그러나 상황은 그다지 다르지 않을 것입니다. 이 결과의 삶의 의미? " 예를 들어 이것이 생물학적 실험이라면 특정 결과의 생물학적 중요성을 찾고 p- 값을 그대로보고하고 생물학에 대해 언급합니다.

— nico

@nico 이것은 이미 내 항목의 요점이었다 (2); 그것은 (1)의 공식적인 접근 방식에 지나치게 의존에 대한 주장

— Glen_b -Reinstate 모니카

글렌과 니코에게 감사합니다. 데이터의이 부분은 실험에 부수적이기 때문에 값을 그대로보고했습니다. 어쨌든, 나는 이것을 받아 들인 대답으로 표시하고 있습니다. 답변이나 의견에 참여한 모든 사람에게 다시 감사합니다.

— Islam El-Nabarawy

그것은 보는 사람의 눈에있다.

$\alpha$ $\alpha=0.05$

따라서 AlefSin이 이전에 언급 한 내용으로 요약됩니다. 귀하의 질문에 대한 "정답"은 없습니다. 당신이 무엇을 얻었는지, 반올림했는지를보고하십시오.

"의의의의"에 관한 거대한 문헌이 있습니다. Schmollers Jahrbuch 131 , 455-468, 2011, 예를 들어 "통계 학적 중요성의 숭배-경제학자들이 데이터 대화를하기 위해해야 할 것과하지 말아야 할 것"에 관한 독일의 주요 통계 학자 Walter Krämer의 최근 논문을 참조하십시오 .

— 해골 전투
소스

-6

$p=0.05$

중요한 문제는 "우리 는 몇 가지 데이터를 발견했습니다 ..." 라는 문구 입니다.

$p$ $p$

이러한 종류의 통계적 부정 행위의 이름은 data dredging 입니다. 나는 논문에서 흥미로운 가설로보고하는 것에 대해 애매 모호하다. 당신이 기대할만한 물리적 인 이유가 있습니까?

그러나 한 가지 방법이 있습니다. 아마 당신은 결정 선험적가 그냥이 수행 한 그냥이에 테스트를 하나 개의 데이터 세트. 당신은 나중에 그것을 증명할 수 있도록 다른 사람 앞에서 실험실 노트북에 그것을 썼습니다. 그런 다음 테스트를 수행했습니다.

$p=0.05$

— 마이크 맥코이
소스

이것은 특정한 문구 선택에 지나치게 의존하고있을 수 있습니다. 당신은 단순히 단어를 잘못 선택했을지도 모릅니다. 여기있는 모든 사람이 영어를 모국어로 사용하는 것은 아닙니다. 잠재적 인 문제로 제기 할 가치가 있지만, 단순히 대머리 ( "절대적으로는 아님")를 말하면 여기에 무엇이 있는지 알 수있는 것 이상을 알 수 있습니다. ( '랩 노트북'에 대한 언급은 OP가 실험실에서 작업을 수행하고 있음을 의미합니다.이 경우는 의심 스럽습니다. 다시, 당신은 우리가 여기보다 더 많은 것을 알고 있음을 암시합니다.)

— Glen_b -Reinstate Monica

Mike McCoy, 답변 해 주셔서 감사합니다.이 경우 Glen_b가 정확합니다. 나는 영어를 모국어로 사용하지 않으며, 기술이 허용하는 한 유창하게 글을 쓰려고 노력하지만, 사용법과 내포가 계속 피하기 어렵습니다. 따라서이 특별한 경우에, 우리는 중요한 것을 발견 할 때까지 다른 것을 시도하지 않았습니다. 실제로, 우리가 증명하려고 한 것은 일부 오류 값에서 통계적으로 유의미한 증가가 없었으며 특정 경우 오류가 실제로 감소되었음을 발견했으며 W 테스트를 실행할 때 0.0499를 얻었습니다. .

— Islam El-Nabarawy

마이크, 나는 또한 그 질문의 문구에서 문제를 보지 못했습니다. 그리고 데이터 스누핑, 광업, 준설 등의 징후를 본 사람은 아무도 없습니다. ... 그리고 그것은 보는 사람의 눈에 분명히 있습니다. 수학적 사실은 없지만 통계학자가 선택한 결정 규칙은 없습니다. 글렌이 쓴 글에서 AlefSin, Glen 글을 읽고 다시 썼습니다.

— Skullduggery

@ IslamEl-Nabarawy 동등성 / 차이를 설정하려면 임계 값에 가까운 값을 해석하는 방법이나 잠재적 인 데이터 스누핑과는 다른 많은 문제가 있습니다. .05를 약간 넘는 (또는 선택한 오류 수준) p- 값을 찾는 것만으로 는 충분하지 않습니다. 여기와 다른 곳에서“동등성 테스트”를 찾거나 완전히 다른 문제이기 때문에 그것에 대해 구체적으로 질문하십시오.

— Gala

"하지만, 한 가지 방법이 있습니다. 아마도이 데이터 세트 하나만으로이 하나의 테스트 만 수행하도록 우선 순위를 결정했을 것입니다. 나중에 노트북 컴퓨터에 누군가 앞에서이를 작성하여 나중에 증명할 수있게했습니다. 당신이 당신의 테스트를했다면, 당신의 결과는 p = 0.05 수준에서 유효하며, 나처럼 회의론자에게 백업 할 수 있습니다. 그렇지 않으면, 통계적으로 유의미한 결과는 아닙니다. " 입증 될 때까지 유죄에 대해 이야기하십시오 순진한. 따라서 학문적 부정직을 배제하는 법 의학적 증거가 없다면 분석이 가치가 없습니까? esh.

— GoF_Logistic 14