통계를 가르 칠 때 "정상"또는 "가우시안"을 사용합니까?


42

내 책에서 주로 "가우스 분포"를 사용하지만 누군가가 "정규 분포"로 전환하도록 제안했습니다. 초보자에게 사용할 용어에 대한 합의가 있습니까?

물론 두 용어는 동의어 이므로 이것은 물질에 대한 질문이 아니라 순전히 어떤 용어가 더 일반적으로 사용되는지의 문제입니다. 그리고 물론 두 용어를 모두 사용합니다. 그러나 어느 것을 주로 사용해야합니까?


1
책의 미리보기 섹션 / 샘플 장이 어딘가에 있습니까? 나는 그것에 대해 좋은 소식을 듣습니다.
Glen_b

2
@Glen_b amazon.com의 "내부 검색"기능을 사용하면 책을 미리 볼 수 있습니다. 또한, 세 장 여기에 사용할 수 있습니다 intuitivebiostatistics.com/excerpts
하비 Motulsky

6
"가우스"배포에 대한 Google 검색은 "정규 배포"에 대한 검색에서 약 2/3의 검색이 있습니다. "어떤 용어 더 일반적으로 사용 되는지"라는 문제 는 쉽게 해결할 수 있습니다. Google Scholar에서는이 비율이 약간 다릅니다. 현재 "가우스 분포"는 "정규 분포"의 히트 수의 절반 ( "역"을 제외하면 1/4)입니다. 이 결과는 (1) "정상"이 더 인기가 있지만 (2) "가우시안"이 널리 인식되고 있음을 시사합니다. 결과를 보면 "무증상 정상"과 같은 문구를 대체하는 데 시간이 오래 걸릴 수 있음을 시사합니다.
whuber

2
@whuber의 확장에서, 나는 필드들 사이에도 차이가 있다고 생각한다 : "가우시안"은 과학에서 상대적으로 더 우세 해 보이는 반면, "정상"은 사회 과학에서 일반적인 용어로 보인다 .
abaumann

1
"비정상"시도 : P
Mehrdad

답변:


47

비록 '정상적인'말을 자주하는 경향이 있지만 (처음으로 배울 때 배운 것이기 때문에) 학생 / 독자가 두 용어에 대해 잘 알고 있다면 "가우시안"이 더 나은 선택이라고 생각합니다.

  • 보통은 특별히 일반적이지 않으므로 이름 자체가 오해의 소지가 있습니다. 그것은 확실히 중요한 역할을 수행하지만 (특히 CLT 때문에) 관찰 된 데이터는 때때로 제안 된 것보다 가우시안 근처에서 훨씬 덜 자주 발생합니다.

  • 단어 (및 "정규화"와 같은 관련 단어)는 통계와 관련이있을 수있는 몇 가지 의미를 갖습니다 (예를 들어 "직교 정상 기저"를 고려하십시오). 누군가가 "샘플을 정규화했습니다"라고 말하면 정규화, z- 점수 계산, 벡터를 단위 길이, 길이 또는 기타 여러 가능성으로 변환했는지 여부를 알 수 없습니다 . 우리가 "가우시안 (Gaussian)"이라는 분포를 부르는 경향이 있다면 적어도 첫 번째 옵션이 제거되고 더 설명적인 것이 그것을 대체합니다.n

  • 가우스는 최소한 분포에 대한 합리적인 정도의 주장을 가지고 있습니다.


3
"학생 / 리더가 두 용어를 잘 알고있는 한"+1. "정상"이 널리 퍼져 있기 때문에 학생들이 "가우시안" 만을 가르치는 것이 장애라고 생각합니다 .
Patrick Coulombe

6
우리 둘 다 가르쳐야한다는 데 동의합니다. 처음부터 시작하여 현재 알고있는 것을 알고 있다면, "1"이라는 용어가 어떤 식 으로든 오버로드되기 때문에 (2) 정상 (가우시안)이 정상적이지 않기 때문에 "정상"이 나오지 않을 것입니다. 데이터 가우스 이전의 역사가 있지만 "가우시안"이 가장 일반적인 대안입니다. 동부 표준시 Jaynes는 "중앙"을 제안했는데, 이는 아이디어 중 하나입니다. (중앙 한 정리의 이론에 근거한 주장을 알고 있습니다.)
Nick Cox

글 머리 기호 # 2와 관련하여 과학 및 수학 전체가 포괄적 일 때 " 일반 "또는 " 가우스 "가 더 일반적 인지 반드시 명확하지는 않습니다 . ;-)
추기경

@ cardinal-나는 그 영역에서 "Gaussian"에 훨씬 더 의존하는 경향이 있다는 제안에 상당히 동의합니다. 또한 엔지니어링을 추가 할 것입니다.
Glen_b

1
@Glen_b : 동의합니다. (즉, 어느 정도 외부, 아마의, 에헴, 규범하지만 내 정신 모델에서, 나는 과학의 일반 우산 아래 엔지니어링을 포함한다.) :-)
추기경

36

가우시안을 사용합니다.

통계를 배우는 사람들이 직면하는 한 가지 문제는 우리가 매일 영어 단어를 사용하여 다른 것을 의미한다는 것입니다 (힘, 의미, 분포 등). 이를 최소화 할 수있는 정도로해야합니다. "정상"은 이미 많은 의미가 있습니다.


2
피터 : 동의합니다. 그래서 항상 "가우스"를 사용했습니다. 그러나 새로운 (간결한) 판에 대한 리뷰어의 의견은 "정상"을 강하게 추진했다.
Harvey Motulsky

25

N(μ,σ2)NG(μ,σ2)


1
GΓGaussGaussianBernoullibinomialbinomN

N

8
GN(μ,σ2)

1
N(μ,σ2)

10

독일어에서는 종종 Gaußsche Normalverteilung 이라고 하므로 쉽게 충돌하기가 거의 불가능합니다.

가우스노멀 을 결합하는 것이 적절 합니까?


8
아마도 gnormal영어로 일할 것 입니다!
Dilip Sarwate

2
@DilipSarwate는 𝅘𝅥𝅮 나는 agnother G 일반 𝅘𝅥𝅮 (. 제군의 약어 플랑드르와 스완에 대한 사과)는 G 일반 해요
홉스

9

Wolfram 백과 사전 에 따르면 :

통계 학자와 수학자들은이 분포에 대해 "정규 분포"라는 용어를 균일하게 사용하지만 물리학 자들은 때때로 이것을 가우시안 분포라고 부르며, 곡선 모양의 플레어 모양 때문에 사회 과학자들은이를 "벨 곡선"이라고합니다.

"정상"이 혼동하기 쉽다는 데 동의하지만 통계 서적은 일반적으로 "정상"을 사용하는 것으로 보입니다.


규범이 아닌 설명적인 답변에 +1 나는 실제로 어떤 분야에 관계없이 가우시안이 선호된다는 다른 대답에 동의하지만, 기존 사용법에서 널리 퍼져있는 것의 맥락에서 시작하는 것이 유익합니다.
R ..

문구 "종형 곡선"에 관해서는, 나는 그것을 피할 것 완전히 어떤 교육 환경에서. 그것은 악명 높은 책의 결과로 같은 이름으로 인종 차별적 인 배음을 가지고 있으며, 그것을 알고있는 모든 학생들은 그것에 의해 산만해질 수 있으며 당신이 말하는 것을 무의미한 이론과 관련시키는 것이 아니라 주제는 저절로 서 있습니다.
R ..

@R .. 설명 적이지만, 그 설명은 여기의 답변과 직접 모순됩니다. 이는 통계 학자와 수학자 중 상당수가 실제로 "가우시안"이라는 용어를 사용한다는 것을 나타냅니다.
David Richerby

가우스 / 정규 분포의 (밀도 함수)를 나타 내기 위해 "벨 커브"라는 용어를 사용 하지 않는 또 다른 이유 는 확률 밀도 함수 (pdf)가 벨 커브와 유사한 분포많기 때문 입니다. 코시 분포의 pdf조차도 종 모양처럼 보입니다!
Mico

다른 분야의 상대적인 용어를 설명하기위한 +1 감사!
매니아

7

S. Stigler는 Normal / Gauss / Laplace-Gauss 분포를 사용 하여 Table on Statistics에 게시 된 'Stigler 's eponymy의 법칙' (일부 페이지는 books.google에서 볼 수 있음 ) 을 증명 합니다.

이 질문과 관련하여 특히 흥미롭고 관련이있는 것은 287-288 페이지에 '정상'대 '가우스'대 '라플라스'의 과거 사용량 테이블이 있으며 수년 동안 사용량이 2:15에서 2 월 15 일로 이동 한 것으로 보입니다. 1816-1884 ~ 8:14 (1888-1917) ~ 5:17 (1919-1939) ~ 9:10 (1947-1976)에서 정상입니다.

따라서 이것에 따르면 '일반'과 '가우스'의 사용법이 점점 더 평등 해지고 있습니다. 또는 추세가 계속 될 것이라고 믿는다면 '가우스'는 50-100 년 안에 '정상'을 이길 것입니다.


5

내가 아직 모든 좋은 답변 중에서 보지 못한 답변 :

나는 이전에 친숙한 이유로 주로 "정상"을 사용하지만 기술적 인 의미를 강조하기 위해 대문자로 사용하고 싶습니다. "... 데이터가 정규적으로 분포 된 경우 ..." 다른 곳이나 (재발 명)


5

어느 것을 사용할지는 가르치는 통계 수준에 달려 있습니다. 불행히도, 나의 교수 경험은 대부분의 학부생들이 확률 분포의 개념을 완전히 이해하지 못한다는 것을 나타냅니다. 그러나 그들은 모두 어떻게 든 CLT와 불확실성에 대해 생각할 수있는 방법을 파악해야합니다. 학부 수업의 경우 보통은 새로운 익숙하지 않은 단어에 대한 불안감을 더하지 않기 때문에 바람직합니다. 대학원생의 경우 가우시안이 위에서 언급 한 정규화에 대한 혼란과 그것이 제공하는 역사적 맥락 때문에 선호됩니다. 나는 두 개의 전제 조건 통계 수업이 필요한 학부 연구 수업을 가르치고 있으며 지난 30 년 동안 사용한 모든 학부 책은 보통을 사용했습니다.


1
"대학생 대부분은 확률 분포의 개념을 완전히 파악하지 못합니다"+1
Code-Guru

4

이름 normal은 오류가 정상적으로 작동한다는 일부 관찰에서 비롯되었습니다. 자세한 내용은 여기를 참조 하십시오 . 이것이이 분포를 정규 분포라고 부르는 이유라면 사고 횟수에 대한 정규 분포가로 인해 새로운 혼란을 야기 할 수 있습니다 poisson. 나는 우리가 앞으로 나아가 야한다고 생각 Gaussian합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.