나는 통계학자는 아니지만 연구 작업에는 통계 (데이터 분석, 문학 읽기 등)가 포함됩니다. 나는 여기 에 게시 된 내 질문 중 하나에 대한 의견에서 통계 분야에서 잘 연습 한 사람들에게 특히 특별한 의미 또는 의미가있는 몇 가지 일반적인 단어가 있음을 상기 시켰습니다 .
그러한 단어의 목록을 갖는 것이 도움이 될 것이며 주석과 함께 구가 될 수 있습니다.
나는 통계학자는 아니지만 연구 작업에는 통계 (데이터 분석, 문학 읽기 등)가 포함됩니다. 나는 여기 에 게시 된 내 질문 중 하나에 대한 의견에서 통계 분야에서 잘 연습 한 사람들에게 특히 특별한 의미 또는 의미가있는 몇 가지 일반적인 단어가 있음을 상기 시켰습니다 .
그러한 단어의 목록을 갖는 것이 도움이 될 것이며 주석과 함께 구가 될 수 있습니다.
답변:
" 중요한 "-여기서 단어의 일반적인 언어 사용은 '중요한'또는 '의미있는'과 같은 것을 의미합니다. 통계적 의미는 비공식적으로 "null에 대한 임의의 변화로부터 식별 될 수있다"; 차이가 충분히 크다는 것을 의미하지는 않습니다.
다음은 이러한 구별이 혼란의 원인 일 수있는 몇 가지 예입니다. 1 2
' 모수 '-종종 과학 실험에서 '모수'라는 단어는 통계학자가 '가변'이라는 단어를 사용하는 방식으로 사용되는 것으로 보입니다. Wikipedia는 다음과 같이 말합니다.
통계 모수는 확률 분포 패밀리를 색인화하는 모수입니다. 모집단 또는 모형의 수치 적 특성으로 간주 될 수 있습니다.
이것이 문제가 될 수있는 예 : 1- 아마도이 질문을했던 게시물 일 것입니다. (최근에 다른 것을 보았지만 지금은 찾을 수 없습니다)
나는 "가설을 위조하는"에서와 같이 "위조"를 사용하는 문제를 겪었지만 다른 사람들은 "데이터 구성"을 언급하고 있다고 생각했다. 또한 " 바이어스 드 (bias) "는 혼동을 일으키지 않고 언급하는 것이 거의 불가능합니다.
"normal" -일반적인 말로, normal은 평범하지 않은 것으로 예상되는 것을 의미합니다. 통계에서 변수가 정규 분포 인 경우 가우시안 분포를 나타냅니다. 나는 일반적인 단어의 의미와 구별하기 위해 "정상"이라는 단어를 대문자로 표기하는 것이 표준이 아니라고 생각합니다.
"정규화 / 표준화" -통계에서 변수를 정규화하면 평균을 빼고 표준 편차로 나눕니다.
"표준 편차 대 표준 오류" -표준 편차는 일반적으로 전체 모집단을 사용하여 계산되는 반면 표준 오류는 표본을 사용하여 계산됩니다.
"파라 메트릭"대 "비 파라 메트릭": "정상"또는 "정상이 아닌"데이터가 필요한 테스트 범주. 비모수 적 테스트보다 모수 적 테스트가 선호됩니다.
일반적인 테스트 : T- 테스트 (페어링), Mann-Whitney U, ANOVA, Anderson-Darling 등
다른 용어에는 "유의 한"이 포함됩니다. 이는 데이터가 귀하의 가설이 유효한지 여부를 나타내는 척도입니다. 가설을 어느 정도의 가능성 (보통 95 %)으로 테스트 할 때 "p- 값"이 0.05보다 작 으면 "널 가설"을 기각하고 (데이터 세트가 다르지 않음) " 대립 가설 "(즉, 데이터 세트가 다름).
샘플 : 통계에서 이것은 일련의 사례를 나타내지 만 , 다른 많은 분야 에서 샘플 은 하나의 물리적 표본 입니다. 물론 표본 크기 도 모호하여 통계 표본의 사례 수 또는 표본의 물리적 크기 (질량, 부피 등)를 나타냅니다.
민감도 : 의료 진단을 위해 테스트에서 인식되는 질병 사례의 비율. 분석 화학 : 교정 곡선의 기울기 (아래 참조).
특이성 : 의료 진단에서 비 질병 사례의 비율은 시험에 의해 올바르게 인식됩니다. 분석 화학에서 교차 감도가없는 방법은 구체적입니다.
교정 : 실제로 위키 기사의 통계에 대해 두 가지 의미가 이미 나열되어 있습니다. 화학과 물리학에서 역 회귀의 의미는 일반적인 것입니다. 그러나 혼란은 다음과 같습니다.
유효성 검사 세트 : 여기서 나는 다시 대조하지만, 다른 통계 관련 분야 에서 이미 발생한다고 생각되는 용어의 잠재적 혼동 사용에주의를 기울이고 싶습니다 . 중첩 / 이중 유효성 검증 또는 최적화 대 유효성 검증 / 테스트와 관련하여 한 줄의 용어는 훈련-유효성 검증-테스트를 분리하고 하이퍼 파라미터 최적화를 위해 "유효성 검증"세트를 사용합니다.
예 : 통계 학습 의 요소, p. 두 번째 에디션의 222 :
... 데이터 세트를 훈련 세트, 검증 세트 및 테스트 세트의 세 부분으로 나눕니다. 훈련 세트는 모델에 적합합니다. 검증 세트는 모델 선택에 대한 예측 오차를 추정하는데 사용되며; 테스트 세트는 최종 선택된 모델의 일반화 오류를 평가하는 데 사용됩니다.
대조적으로, 예를 들어 분석 화학 검증에서 모델 (실제로, 최종 모델의 평가는 분석 방법의 검증의 일부일 뿐임)이 응용 분야에 적합하고 성능을 측정 함을 입증하는 절차입니다 (예 : John 참조) K. Taylor : 분석 방법의 검증, 분석 화학 1983 55 (6), 600A-608A
또는 FDA와 같은 기관의 지침. 이것은 "유효성 검증"이 실제로 최적화에 사용되는 다른 용어로 "테스트"입니다.
중요한 차이점은 "최적화 유효성 검사"결과가 모델을 변경 (선택)하는 데 사용되는 반면, 검증 된 분석 방법 (데이터 분석 모델 포함)의 변경은 재확인 해야한다는 의미입니다. (즉, 방법이 작동하는 것으로 여전히 작동한다는 것을 증명하십시오).
화학자와 대화해야하는 경우, 분석 화학 용어에 대한 참조는 Danzer : Analytical Chemistry-이론 및 도량 기본, DOI 10.1007 / b103950입니다.