특정 통계적 의미가있는 일반적인 단어


12

나는 통계학자는 아니지만 연구 작업에는 통계 (데이터 분석, 문학 읽기 등)가 포함됩니다. 나는 여기 에 게시 된 내 질문 중 하나에 대한 의견에서 통계 분야에서 잘 연습 한 사람들에게 특히 특별한 의미 또는 의미가있는 몇 가지 일반적인 단어가 있음을 상기 시켰습니다 .

그러한 단어의 목록을 갖는 것이 도움이 될 것이며 주석과 함께 구가 될 수 있습니다.


1
Community Wiki 의 후보 인 것 같습니다 .
Glen_b-복귀 모니카

@Glen_b 통계 나 수학의 어떤 용어라도 자격이 있다고 가정하면 특히 큰 것으로 바뀔 수 있습니다. 이 질문의 범위를 의미있게 좁힐 수있는 방법이 있습니까?
whuber

3
@ whuber 그렇습니다. 지나치게 광범위해질 위험이 있습니다. 범위를 좁히기 위해 "일반적으로 혼동을 일으키는"것과 같은 것이 충분합니까?
Glen_b-복지 주 모니카

유능한 통계 학자들은 보통 모국어를 잘 구사하며 평신도에게 적절하게 설명해야하는 전문 용어를 사용하는 경우를 잘 알고 있다고 생각합니다.
Robert Jones

@Glen_b 확실하지 않습니다. 정확도, 편의, 교정, 차별, 연속, 분포, 위험, 생존, 스플라인, 모델, 응답, 부트 스트랩, 조정, 클러스터, 조건부, 신뢰도, 밀도 등 다루어야 할 단어 목록을 거의 시작할 수 없습니다. , 추정, 변수, 표준, 상관, 예측, 추론, 검열, 위험, 일치, 로지스틱, 제한, 적용 범위, 혼란, 우발, 수렴, 대응, 자유, 이탈, 지수, 극단, 범위, 정상, 드롭 인, 더미 , 설명 [변이], 계수, 실패, 채우기, 적합, 적합, 기능, ...
whuber

답변:


12

" 중요한 "-여기서 단어의 일반적인 언어 사용은 '중요한'또는 '의미있는'과 같은 것을 의미합니다. 통계적 의미는 비공식적으로 "null에 대한 임의의 변화로부터 식별 될 수있다"; 차이가 충분히 크다는 것을 의미하지는 않습니다.

다음은 이러한 구별이 혼란의 원인 일 수있는 몇 가지 예입니다. 1 2

' 모수 '-종종 과학 실험에서 '모수'라는 단어는 통계학자가 '가변'이라는 단어를 사용하는 방식으로 사용되는 것으로 보입니다. Wikipedia는 다음과 같이 말합니다.

통계 모수는 확률 분포 패밀리를 색인화하는 모수입니다. 모집단 또는 모형의 수치 적 특성으로 간주 될 수 있습니다.

이것이 문제가 될 수있는 예 : 1- 아마도이 질문을했던 게시물 일 것입니다. (최근에 다른 것을 보았지만 지금은 찾을 수 없습니다)


11

"오류"-통계에서 종종 관측 값과 예측값 사이의 편차를 의미합니다. 실제로는 실수를 의미합니다.


11

2010 년부터이 질문에 대한 참고 논문을 찾았습니다.

앤더슨 쿡 CM. 숨겨진 전문 용어 : 통계에 특정한 의미를 갖는 매일의 단어. ICOTS8, 2010 년 7 월 11-17 일 슬로베니아 류블 랴나, 교육 통계 국제 회의.

이 논문은 온라인으로 무료로 제공되므로 저자가 논의하는 용어의 일부만 제공합니다.

 confounding, control, factor, independent, random, uniform

10

나는 "가설을 위조하는"에서와 같이 "위조"를 사용하는 문제를 겪었지만 다른 사람들은 "데이터 구성"을 언급하고 있다고 생각했다. 또한 " 바이어스 드 (bias) "는 혼동을 일으키지 않고 언급하는 것이 거의 불가능합니다.


6

"normal" -일반적인 말로, normal은 평범하지 않은 것으로 예상되는 것을 의미합니다. 통계에서 변수가 정규 분포 인 경우 가우시안 분포를 나타냅니다. 나는 일반적인 단어의 의미와 구별하기 위해 "정상"이라는 단어를 대문자로 표기하는 것이 표준이 아니라고 생각합니다.

"정규화 / 표준화" -통계에서 변수를 정규화하면 평균을 빼고 표준 편차로 나눕니다.

"표준 편차 대 표준 오류" -표준 편차는 일반적으로 전체 모집단을 사용하여 계산되는 반면 표준 오류는 표본을 사용하여 계산됩니다.


1
나는 "표준 오류"가 그 단어의 다른 용도 (구문)와는 다른 특별한 통계적 의미를 갖는 "일반적인, 비 통계적"단어라는 것을 정말로 의심한다. "정규화"및 "표준 편차"
whuber

어쩌면 "정규화"가 아니라 "정상"이 좋은 점일 수도 있고 "표준화"도 될 것입니다.이 표준은 국가 표준을 확립하기위한 시험을 설명하는 데에도 사용됩니다 (예 : 미국에서 아동을 떠난 후 미국에서와 같이 교육에서) 뒤에). 나는 "표준 편차"가 혼동을 일으키지 않을 것이라는 데 동의하지만, 공통 용어로 "편차"자체가 부정적인 의미를 가질 가능성이 더 높을 수 있습니다 (특히 "편차"의 동의어).
Nick Stauner

SD와 SEM을 구별하는 또 다른 방법이 있습니다. 표준 편차는 변동 또는 산포를 정량화합니다. 표준 오차는 계산 된 값의 정밀도를 정량화합니다.
Harvey Motulsky

@HarveyMotulsky 가장 좋은 방법은 소행성 (불규칙한 모양)을 생각하는 것입니다. 소행성의 질량 중심은 무엇입니까? 그것은 다른 모든 점들과 등거리에있는 점입니다. 그게 평균입니다. 표준 편차는 무엇입니까? 중심으로부터 각 점의 "평균"거리, 크기 측정 단위입니다. SEM이란 무엇입니까? 소행성 중심의 위치에 대해 얼마나 확신하는지 알려줍니다.
플라스크

표준 오류는 "샘플"을 사용하여 계산 된 표준 편차라고 생각합니다. 표준 오차는 검정 통계량의 표준 편차 인 반면, 그것은 저에 대한 표본 분산의 제곱근입니다. 또한 위의 용어에서 "정상"만 실제로 일반적으로 보입니다. 그러나 그것은 정상적인 것 같아요.
의미 의미

2

"파라 메트릭"대 "비 파라 메트릭": "정상"또는 "정상이 아닌"데이터가 필요한 테스트 범주. 비모수 적 테스트보다 모수 적 테스트가 선호됩니다.

일반적인 테스트 : T- 테스트 (페어링), Mann-Whitney U, ANOVA, Anderson-Darling 등

다른 용어에는 "유의 한"이 포함됩니다. 이는 데이터가 귀하의 가설이 유효한지 여부를 나타내는 척도입니다. 가설을 어느 정도의 가능성 (보통 95 %)으로 테스트 할 때 "p- 값"이 0.05보다 작 으면 "널 가설"을 기각하고 (데이터 세트가 다르지 않음) " 대립 가설 "(즉, 데이터 세트가 다름).


2

통계에 치우친 것은 분포가 비대칭임을 의미합니다.

평범한 언어로, 심지어 과학 내에서도, "왜냐하면 많은 농구 선수를 포함시켜 평균 키에 대한 결과가 왜곡된다"와 같이, 통계적 사람들이 일반적으로 편향 이라고 부르는 것을 의미하기 위해 종종 기울어 짐 (및 점점 더?)이 사용됩니다 .


2

추정 -통계에서 계산 결과입니다. 예를 들어 표본 평균은 모집단 평균의 추정치이고 평균의 신뢰 구간은 모집단 평균의 구간 추정치입니다. 이 두 가지 모두 정확한 계산 결과입니다. "추정"은 표본의 데이터에서 모집단에 대한 추론을 시도하는 정확한 일반화입니다.

일반적으로 단어 추정 은 정보에 근거한 추측 또는 직감 또는 대략적인 계산 결과를 의미합니다.


2

θXL(θ|X)=Pr(X|θ)

대표 -일상적인 관점과 과학적인 관점에서 때때로 상충되는 의미가 있습니다. 크루스 칼 & Mosteller을 참조하십시오 1979a , 1979b , 1979c1980 . 내가 아는 대부분의 통계학자는 표본 확률이 알려진 확률로 표본 추출 된 경우 표본 대표자를 고려할 것입니다. 내가 아는 대부분의 평신도들은 한계 분포가 인구와 비슷하다면 그것을 대표적이라고 생각할 것이다.


2
  • 샘플 : 통계에서 이것은 일련의 사례를 나타내지 만 , 다른 많은 분야 에서 샘플 은 하나의 물리적 표본 입니다. 물론 표본 크기 도 모호하여 통계 표본의 사례 수 또는 표본의 물리적 크기 (질량, 부피 등)를 나타냅니다.

  • 민감도 : 의료 진단을 위해 테스트에서 인식되는 질병 사례의 비율. 분석 화학 : 교정 곡선의 기울기 (아래 참조).

  • 특이성 : 의료 진단에서 비 질병 사례의 비율은 시험에 의해 올바르게 인식됩니다. 분석 화학에서 교차 감도가없는 방법은 구체적입니다.

  • 교정 : 실제로 위키 기사의 통계에 대해 두 가지 의미가 이미 나열되어 있습니다. 화학과 물리학에서 역 회귀의 의미는 일반적인 것입니다. 그러나 혼란은 다음과 같습니다.

    • IcI=f(c)cc=f1(I)c=f(I)
      cI
    • "교정도"(통계 통계)라고하는 실제 확률에 대한 예측 확률도를 보았습니다. 분석 화학에서 해당 교정 플롯은 측정 된 신호 (일반적으로 다른 단위)에 대한 확률을 예측합니다. 참 종속 변수에 대한 예측 도표는 일반적으로 회복 곡선 이라고 합니다 .
  • 유효성 검사 세트 : 여기서 나는 다시 대조하지만, 다른 통계 관련 분야 에서 이미 발생한다고 생각되는 용어의 잠재적 혼동 사용에주의를 기울이고 싶습니다 . 중첩 / 이중 유효성 검증 또는 최적화 대 유효성 검증 / 테스트와 관련하여 한 줄의 용어는 훈련-유효성 검증-테스트를 ​​분리하고 하이퍼 파라미터 최적화를 위해 "유효성 검증"세트를 사용합니다.
    예 : 통계 학습요소, p. 두 번째 에디션의 222 :

    ... 데이터 세트를 훈련 세트, 검증 세트 및 테스트 세트의 세 부분으로 나눕니다. 훈련 세트는 모델에 적합합니다. 검증 세트는 모델 선택에 대한 예측 오차를 추정하는데 사용되며; 테스트 세트는 최종 선택된 모델의 일반화 오류를 평가하는 데 사용됩니다.

    대조적으로, 예를 들어 분석 화학 검증에서 모델 (실제로, 최종 모델의 평가는 분석 방법의 검증의 일부일 뿐임)이 응용 분야에 적합하고 성능을 측정 함을 입증하는 절차입니다 (예 : John 참조) K. Taylor : 분석 방법의 검증, 분석 화학 1983 55 (6), 600A-608A 또는 FDA와 같은 기관의 지침. 이것은 "유효성 검증"이 실제로 최적화에 사용되는 다른 용어로 "테스트"입니다.
    중요한 차이점은 "최적화 유효성 검사"결과가 모델을 변경 (선택)하는 데 사용되는 반면, 검증 된 분석 방법 (데이터 분석 모델 포함)의 변경은 재확인 해야한다는 의미입니다. (즉, 방법이 작동하는 것으로 여전히 작동한다는 것을 증명하십시오).


화학자와 대화해야하는 경우, 분석 화학 용어에 대한 참조는 Danzer : Analytical Chemistry-이론 및 도량 기본, DOI 10.1007 / b103950입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.