sciencemag.org에 관한 기사 를 읽는 동안이 문장을 만났습니다 .
결국, 남은 데이터가 통계적으로 유의미한 것으로 간주되지 않았기 때문에 12 개국 7600 명의 연구원들의 응답이 포함되었습니다.
이것이 적절한 연구 방법입니까? 통계적으로 유의하지 않은 것으로 간주되어 결과를 남기지 않겠습니까?
sciencemag.org에 관한 기사 를 읽는 동안이 문장을 만났습니다 .
결국, 남은 데이터가 통계적으로 유의미한 것으로 간주되지 않았기 때문에 12 개국 7600 명의 연구원들의 응답이 포함되었습니다.
이것이 적절한 연구 방법입니까? 통계적으로 유의하지 않은 것으로 간주되어 결과를 남기지 않겠습니까?
답변:
에서 보고서 whuber의 코멘트를 인용, 그것은 [PDF에서 페이지 114] 104 페이지 말한다 :
이 설문 조사는 30 개 이상의 국가에서 약 8,900 명의 박사 후보자들의 참여를 활성화시키는 데 성공했습니다 ...
그런 다음 104-105 페이지에 걸쳐 다음과 같이 말합니다.
데이터 정리 절차를 수행하는 동안 Eurodoc 설문 조사 전문가 팀은 전력 테스트 분석을 실행하기로 결정했습니다. 다중 정규 분포를 초래하는 완전히 완성 된 설문지를 가정하여 신뢰 구간 추정을위한 검정력 테스트를 사용했습니다. 이것은 데이터의 정확성을 테스트하기 위해 수행되었습니다. 95 % 신뢰 구간에서 최대 6 %의 오류 수준을 수용하기로 결정했습니다. 표본 추출 크기의 16 %가 손실되면 7,600 명이 참여한 12 개국의 표본이 생성되었습니다.
따라서 표본에서 16 % 손실이 발생하는 이유를 정확히 알 수는 없지만 불완전한 반응에 대한 가정은 정확할 것입니다. (그리고 당신은 기자가 왜 혼란했는지 알 수 있습니다.)
그 문장은 실제로 의미가 없으며 분명히 잘못되었습니다.
데이터 는 통계적으로 중요하거나 중요하지 않을 수 있습니다. 통계 테스트의 결과 인 데이터 간의 관계 만이 용어로 설명 할 수 있습니다.
질문 인 경우 : 해당 데이터를 포함하면 귀무 가설을 기각 할 수 없기 때문에 분석에서 데이터를 삭제할 수 있습니까? 대답은 – 분명히, 나는 희망한다! — 아니요 . 인용 한 메시지는 과학 보고서가 아니라 뉴스 보고서입니다. 그것이 검토 된 논문 이었다면 결코 들어 가지 않았을 것입니다.
데이터가 포함되지 않은 실질적인 이유가 있기 때문에 데이터가 포함되지 않았을 수 있습니다. 아마도 다른 사람들이 제안했듯이 제외 된 데이터는 불완전하거나 다른 방법이나 비교할 수없는 방법을 사용하여 수집되었을 수 있습니다.