나는 최근 논문의 통계 검토 에 관한 일반적인 원칙에 관한 질문 을했다 . 내가 지금 묻고 싶은 것은, 논문을 검토 할 때 특히 당신을 짜증나게하는 것입니다.
답변 당 하나의 예를 참조하십시오.
나는 최근 논문의 통계 검토 에 관한 일반적인 원칙에 관한 질문 을했다 . 내가 지금 묻고 싶은 것은, 논문을 검토 할 때 특히 당신을 짜증나게하는 것입니다.
답변 당 하나의 예를 참조하십시오.
답변:
특히 개인적 으로 나를 자극하는 것은 통계 소프트웨어에 사용자 작성 패키지를 명확하게 사용했지만 제대로 인용하지 않았거나 전혀 인용하지 않아서 저자에게 아무런 신용도를주지 않는 사람들입니다. 저자가 학계에 있고 그들의 직무 가 인용되는 논문 을 출판 할 때 그렇게하는 것이 특히 중요하다 . (아마도 필자는 필자의 분야에서 많은 범인이 통계학자가 아니라고 덧붙여 야한다.)
맙소사, 많은 것들이 떠오른다 ...
단계적 회귀
p- 값을 주지만 효과 크기는 측정하지 않습니다.
데이터가 다소 대칭적이고 단조로운 지 여부를 나타내지 않고 평균 및 표준 편차를 사용하여 데이터 설명
명확한 캡션이없는 그림 (그런 오차 막대 평균의 표준 오차 또는 그룹 내 표준 편차입니까?)
아이린 스트랫 턴 (Irene Stratton)과 동료는 밀접하게 관련된 질문에 대한 짧은 논문을 발표했습니다.
Stratton IM, Neil A. 통계 검토자가 논문을 거부하는 방법 . 당뇨병 약 2005; 22 (4) : 371-373.
표절 (이론적 또는 방법 론적). 저의 첫 번째 검토는 실제로 10 년 전에 출판 된 잘 확립 된 방법 론적 논문에서 많은 참조되지 않은 사본 / 붙여 넣기를 묘사 한 논문에 대한 것입니다.
이 주제에 관한 흥미로운 논문 몇 개를 발견했습니다 : 과학의 권위와 표절 .
같은 맥락에서, 나는 (데이터 또는 결과에 대한) 위조 가 최악의 것을 발견합니다.
저자에게 요청할 때
(1) 또는 (2)의 설명 된 결과가 MS에서 사라지는 경우에 저자는 실제로 대답하지 않습니다.
그들이 분석을 충분히 설명하지 못하거나 실제 오류를 해결하기 어려운 간단한 오류를 포함 할 때. 여기에는 설명을 통해 많은 전문 용어를 던지는 것이 포함되는데, 이는 저자가 알고있는 것보다 더 모호하며 잘못 사용될 수도 있습니다.
기존 개념에 대한 새로운 단어가 나오거나 그 반대의 경우에도 기존 용어를 사용하여 다른 것을 나타냅니다.
기존의 용어 차이 중 일부는 문헌에서 오랫동안 정착되어있다 : 생물 통계학의 종 방향 데이터 대 계량 경제학의 패널 데이터; 사회학의 원인 및 결과 지표 대 심리학의 형성 및 반사 지표; 등. 나는 여전히 그들을 미워하지만, 적어도 당신은 각각의 문헌에서 그들 각각에 대한 수천의 참조를 찾을 수 있습니다. 가장 최근의 한 가지 원인은 인과 적 문헌에서 방향성 비순환 그래프에 관한 전체 연구이다. 이들 모두의 식별 및 추정 이론의 대부분은 1950 년대에 동시 방정식의 이름으로 계량 경제학자에 의해 개발되었다.
삼중이 아닌, 이중을 갖는 용어는 "견고하다"이며, 상이한 의미는 종종 모순된다. "견고한"표준 오류는 훨씬 특이한 사람들에게는 강력하지 않습니다. 게다가, 이들은 모델로부터의 가정 된 편차를 제외하고는 강력하지 않으며 종종 작은 샘플 성능을 가지고 있습니다. White의 표준 오류는 직렬 또는 군집 상관에 대해 강력하지 않습니다. SEM의 "강력한"표준 오류는 모델 구조의 잘못된 사양 (생략 된 경로 또는 변수)에 대해 강력하지 않습니다. 귀무 가설 유의성 검정에 대한 아이디어와 마찬가지로 누구에게도 손가락을 대고 말하기는 불가능합니다. "여러 세대의 연구원들이 실제로는 그 이름에 맞지 않는이 개념을 만들어 낸 것에 대해 혼동 할 책임이 있습니다."
gllamm
데이터를 다중 레벨 / 계층 데이터로 생각 하는 Stata 패키지 가 있지만 대부분의 다른 패키지는 다중 측정을 변수 / 열로, 샘플을 관찰 / 행으로 생각합니다.
누락 된 데이터를 전혀 고려하지 않습니다.
많은 실제 응용 프로그램은 최소한 일부 결 측값이있는 데이터를 사용합니다. 이것은 역학에서 확실히 사실입니다. 누락 된 데이터는 선형 모델을 포함하여 많은 통계 방법에 문제가 있습니다. 선형 모형의 결측 데이터는 공변량의 결측 데이터가있는 사례를 삭제하여 처리하는 경우가 많습니다. 데이터가 임의로 완전하지 않다는 가정하에 데이터가 누락되지 않는 한 이는 문제입니다.
아마도 10 년 전에는 누락을 더 이상 고려하지 않고 선형 모델의 결과를 게시하는 것이 합리적이었습니다. 나는 확실히 유죄입니다. 그러나 여러 대치로 결측 된 데이터를 처리하는 방법에 대한 매우 유용한 조언이 통계 패키지 / 모델 / 라이브러리 등에서와 같이 널리 사용 가능합니다. 누락이있을 때보다 합리적인 가정하에보다 적절한 분석을 촉진합니다.
"중요한 접근 (예 : p <.10) 효과를보고 더 엄격하고 수용 가능한 수준에서 중요성을 달성 한 것처럼 작성하는 효과보고. 중첩되지 않은 다중 구조 방정식 모델 실행 잘 확립 된 분석 전략을 취하여 이전에 아무도 사용하지 않았던 것처럼 제시 한 전략을 제시했을 것입니다.
다음 두 기사를 추천합니다.
Martin Bland :
통계 심판을 화나게하는 방법
이것은 다른 통계 심판 ( '응답률이 낮은 편의성 샘플')의 데이터와 함께 Martin Bland가 제공 한 일련의 대화를 기반으로합니다. '통계 심판을 화나게하는 것을 피하기위한 11 포인트 목록'으로 끝납니다.
Stian Lydersen :
통계적 검토 : 자주 언급되는 의견
이 최근 논문 (2014/2015 발행)에는 약 14 가지의 저자에 대한 저자의 가장 일반적인 14 가지 의견 이 나열되어 있습니다. 과학 논문에 대한 200 건의 통계 검토 (특정 저널에서). 각 의견에는 문제점에 대한 간략한 설명과 분석 /보고 를 올바르게 수행하는 방법에 대한 지침이 있습니다. 인용 문헌 목록은 흥미로운 논문의보고입니다.
테스트 데이터가 독립적이지 않은 예측 모델의 일반화 오류를 목표로하는 "유효성"에 대해 가장 (그리고 가장 빈번하게) 짜증납니다 (예 : 일반적으로 데이터에서 환자 당 여러 측정, 부트 스트랩 외 또는 교차 검증 분할 측정이 아님) 환자 ).
더 성가신 교차 검증 결과와 교차 검증의 과도 적 바이어스를 보여 주지만 교차 검증의 설계가 잘못되었다는 단일 단어가 아닌 독립적 테스트 세트를 제공하는 논문 ...
(동일한 데이터가 제시 될 경우 완벽하게 기뻐할 것입니다. "우리는 교차 검증이 환자를 분할해야한다는 것을 알고 있지만이를 허용하지 않는 소프트웨어를 고수하고 있습니다. ")
(또한 부트 스트랩 핑 = 교체를 통한 리샘플링은 일반적으로 교차 검증 = 리샘플링을 사용하지 않는 리샘플링보다 성능이 우수하다는 것을 알고 있습니다. 부트 스트랩의 전체적인 불확실성이 비슷했습니다 .oob은 더 치우침이 있지만 분산은 적습니다 .- 되풀이하기 위해 이것을 매우 실용적인 관점에서보고 있습니다. 제한된 테스트 샘플 크기로 인해 환자 단위로 분할되거나보고 / 토론 / 멘션 무작위 불확실성이 없습니다.)
잘못된 것 외에도 이것은 올바른 검증을하는 사람들이 종종 그들의 결과가 문헌의 다른 모든 결과보다 훨씬 더 나쁜 이유를 방어해야한다는 부작용이 있습니다.
단수의 의미에서 "데이터"사용. 데이터는 그렇습니다.