최초의 표준 정규표는 누가 만들었습니까?


61

입문 통계 수업에서 표준 정규표를 소개하려고하는데 누가 처음 표준 정규표를 작성 했습니까? 컴퓨터가 나오기 전에 어떻게 했습니까? 나는 수천 명의 리만 총계를 손으로 계산하는 무차별 대인을 생각하고 떨었습니다.


5
역사적으로 정보를 가르치고 싶은 사람을 만나서 반갑습니다.
mdewey

답변:


62

Laplace는 표의 필요성을 가장 먼저 인식하여 근사치를 얻었습니다.

G(x)=xet2dt(1)=1x12x3+134x51358x7+135716x9+

정규 분포의 첫 번째 현대 테이블은 나중에 프랑스 천문학 자 Christian Kramp 에 의해 Anasze des Réfractions Astronomiques et Terrestres (Par le citoyen Kramp, Professeur de Chymie et de Physique expérimentale à l' école centrale du Département de la Roer, 1799)에서 지어졌습니다. . 정규 분포와 관련된 표 에서 : 짧은 역사 저자 (들) : Herbert A. David 출처 : 미국 통계 학자, Vol. 59, No. 4 (2005 년 11 월), 309-311 쪽 :

야심 차게, Kramp는 보간에 필요한 차이와 함께 최대 D에서 D에서 및 D에서 까지 진수 ( D) 테이블을 제공했습니다 . 상반기 유도체 적어 그가 단순히의 테일러 급수 확장을 사용하여 에 대해 가진 의 기간까지이것은 를 곱하면 에서 까지 단계별로 진행할 수 있습니다.8x=1.24, 91.50, 101.99,113.00G(x),G(x+h)G(x),h=.01,h3.x=0x=h,2h,3h,,hex2

1hx+13(2x21)h216(2x33x)h3.
따라서 때이 곱은 하여x=0
.01(113×.0001)=.00999967,
G(.01)=.88622692.00999967=.87622725.


여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

하지만 ... 얼마나 정확할까요? OK, 이제 봅시다 예를 들어 :2.97

여기에 이미지 설명을 입력하십시오

놀랄 만한!

가우스 pdf의 현대식 (정규화 된) 표현으로 넘어 갑시다.

의 pdf 는 다음과 같습니다.N(0,1)

fX(X=x)=12πex22=12πe(x2)2=12πe(z)2

여기서 입니다. 따라서 입니다.z=x2x=z×2

R로 가서 ...을 . 그렇게 빠르지는 않습니다. 먼저 지수 함수 지수를 곱하는 상수가있는 경우 적분은 해당 지수로 나누어집니다 : . 이전 테이블의 결과를 복제하는 것을 목표로하기 때문에 실제로 값 에 곱하여 분모에 표시해야합니다.PZ(Z>z=2.97)eax1/ax2

또한 Christian Kramp는 정규화되지 않았으므로 R에 의해 주어진 결과에 곱하여 수정해야합니다 . 최종 수정은 다음과 같습니다.2π

2π2P(X>x)=πP(X>x)

위의 경우 및 입니다. 이제 R로 가자 :z=2.97x=z×2=4.200214

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.00002363235e-05

환상적인!

재미를 위해 테이블 ​​상단으로 이동합시다. ...0.06

z = 0.06
(x = z * sqrt(2))

(R = sqrt(pi) * pnorm(x, lower.tail = F))
[1] 0.8262988

Kramp는 무엇입니까? .0.82629882

너무 가까이 ...


문제는 ... 정확히 얼마나 가깝습니까? 모든 투표권을받은 후에는 실제 답변을 남기지 못했습니다. 문제는 내가 시도한 모든 광학 문자 인식 (OCR) 응용 프로그램이 엄청나게 꺼져 있다는 것입니다. 원본을 보아도 놀라운 것은 아닙니다. 그래서 저는 테이블 프리미어 의 첫 번째 열에 각 숫자를 개인적으로 입력했을 때 Christian Kramp가 그의 작품의 강점에 대해 감사하는 것을 배웠습니다 .

@Glen_b의 귀중한 도움을 받으면 매우 정확할 수 있으며이 GitHub 링크 에서 R 콘솔에 복사하여 붙여 넣을 수 있습니다 .

그의 계산 정확도에 대한 분석은 다음과 같습니다. 너 자신을 ...

  1. [R] 값과 Kramp의 근사값 간의 절대 누적 차이 :

0.000001200764 -의 과정에서 계산, 그는 약의 오차가 축적 관리 만분!3011

  1. 평균 절대 오차 (MAE) 또는mean(abs(difference))로를difference = R - kramp:

0.000000003989249 그는 평균적으로 끔찍한 십억 오류 를 만들었습니다 !3

그의 계산이 [R]에 비해 가장 분기 된 항목에서 첫 번째 다른 소수점 자리 값은 8 번째 위치 (100 만 번째)에있었습니다. 평균 (중간 값)의 첫 번째 "실수"는 10 번째 10 진수 (100 억)입니다. 그리고 어떤 경우에도 [R]에 완전히 동의하지는 않았지만 가장 가까운 항목은 13 개의 디지털 항목까지 발산되지 않습니다.

  1. 평균 상대 차이 또는 mean(abs(R - kramp)) / mean(R)(와 동일 all.equal(R[,2], kramp[,2], tolerance = 0)) :

0.00000002380406

  1. 근 평균 제곱 오차 (RMSE) 또는 편차 (큰 실수에 더 많은 가중치를 부여)는 다음과 같이 계산됩니다sqrt(mean(difference^2)).

0.000000007283493


Chistian Kramp의 사진이나 초상화를 찾으면이 게시물을 편집하여 여기에 올리십시오.


4
두 개의 다른 참조를 갖는 것이 좋으며, Laplace가 위 꼬리에 제공 한 명시 적 확장과 같은 추가 세부 사항이 좋습니다.
Glen_b

1
이것은 최신 편집으로 더 나아지지만 두 번지지 할 수는 없습니다. David의 기사는 왜 Kramp의 테이블이 표시된 모든 자리수에 대한 정확도를 갖지 못한 지 설명합니다 (첫 번째 단계에서 아주 작은 오류가 발생했습니다). 그러나 여전히 대부분의 통계적 적용에 충분합니다
Glen_b

2
@ OlivierGrégoire 잘못 입력 한 10 진수를 지적 해 주셔서 감사합니다. 이제 수정되었습니다. 나는 프랑스어가 필수 였을 때 자랐고, 나는 언어의 기발한 사용에 대해 무례한 의미를 가지지 않았습니다 (내가 거기에 참조가 있지만 결코 신경 쓰지 않았습니다). "citoyen Kramp"는 논문에서 역사적 형태의 소개를 강조하려는 시도입니다.
Antoni Parellada

1
이봐, 이건 헛소리라고 생각해서 미안해 나는 단지 물건을 가리키고 있었고, 나는 당신이 아무것도 무시하고 있다고 말하지 않습니다. 물론 말장난하거나 과장하거나 참조 할 수도 있습니다. 그러나 프랑스어를 사용하는 사람으로서 나는 그것을 얻지 못했습니다 (적어도 전달하려고 시도한 것입니다). "Le citoyen Kramp"에는 문제가 없었습니다. 영어가 아니기 때문에 방금 따옴표를 붙여 넣었습니다. 당신이 그것이 욕설이라고 느꼈다면 미안합니다. 영어 사용도 부족합니다. ^^ 비교가 잘되었습니다!
Olivier Grégoire

1
@ P.Windridge 죄송합니다 ... 깨진 하이퍼 링크가 많이 있다는 것을 깨달았습니다 ...
Antoni Parellada

32

HA David에 따르면 Laplace는 "1783 년 초에 정규 분포 테이블의 필요성을 인식했으며 1799 년 Kramp에 의해 최초 정규 테이블이 생성되었습니다.

Laplace는 에서 의 (분산 법 의 정규 분포에 비례 함 )와 상단 꼬리에 대한 개의 근사치를 제안 했습니다 .0xet212

그러나 Kramp는 유용하게 적용될 수있는 간격에 간격이 있었기 때문에 이러한 일련의 Laplace를 사용하지 않았습니다.

사실상 그 0 꼬리 영역의 적분 시작하고 관한 테일러 전개를 적용 전회 산출 적분 - 그가 어긋남 테이블에 새로운 값을 계산으로 즉, 자신의 테일러 전개의 (여기서 는 상단 꼬리 영역을 제공하는 정수)입니다.xG(x+h)G

구체적으로 말하면, 관련된 두 문장을 인용하십시오 :

그는 단지의 테일러 급수 확장을 사용하여 에 대한 함께 의 기간까지 . 이를 통해 에 를 곱하면 에서 까지 단계별로 진행할 수 있습니다따라서 에서이 곱은 하여 . (4) 왼쪽의 다음 항은 로 표시 될 수 있으므로 생략이 정당화됩니다.G(x+h)G(x)h=.01h3x=0x=h,2h,3h,...hex2x=0.01(11

1hx+13(2x21)h216(2x33x)h3.
x=0G ( .01 ) = .88622692 .00999967 = .87622725 10 9
.01(113×.0001)=.00999967,(4)
G(.01)=.88622692.00999967=.87622725109

David는 테이블이 널리 사용되었음을 나타냅니다.

따라서 수천 개의 Riemann이 아니라 수백 개의 Taylor 확장이 합쳐졌습니다.


작은 메모에서, 핀치 (계산기 및 일반 테이블에서 기억 된 몇 가지 값으로 고정됨)에서 나는 다른 값에서 좋은 근사치를 얻기 위해 Simpson의 규칙 (및 수치 적분 관련 규칙)을 상당히 성공적으로 적용했습니다. 그렇지 않아 모든 정확성의 몇 가지 수치로 축약 테이블 *를 생산하는 지루한. [크 람프의 규모와 정확성에 대한 표를 만드는 것은 비록 그랬듯이 똑똑한 방법을 사용하더라도 상당히 큰 과제가 될 것이다.]

* 약식 표는 기본적으로 너무 큰 정확도를 잃지 않고 테이블 값 사이의 보간으로 벗어날 수있는 표를 의미합니다. 만 3 그림의 정확성 주위에 말하고 싶은 경우에 당신은 정말 계산 할 필요가 없습니다 모든 많은 값을. 다항식 보간법 (보다 정확하게는 유한 차분 기법 적용)을 효과적으로 사용하여 선형 보간법보다 값이 적은 테이블을 허용합니다. 보간 단계에서 다소 많은 노력을 기울이면 로짓 변환으로 보간을 수행했습니다. 선형 보간이 훨씬 더 효과적이지만 계산기가 좋은 경우에만 많이 사용됩니다).

[1] Herbert A. David (2005),
"정규 분포와 관련된 표 : 짧은 역사"
American Statistician , Vol. 59, No. 4 (11 월), 309-311 페이지

[2] Kramp (1799),
분석분석 Astronomiques et Terrestres,
라이프 치히 : Schwikkert


0

재미있는 문제! 첫 번째 아이디어는 복잡한 공식의 통합을 통해 온 것이 아니라고 생각합니다. 오히려, 조합론에서 무증상을 적용한 결과. 펜 및 용지 방법은 몇 주가 걸릴 수 있습니다. Karl Gauss에게는 그의 전임자를위한 파이 계산에 비해 그리 어렵지 않습니다. 가우스의 아이디어는 용기가 있다고 생각합니다. 그에게 계산이 쉬웠다.

처음부터 표준 z 테이블을 작성하는 예-1
. n (n은 20 임)의 모집단을 취하고 그로부터 r 크기 (r은 5)의 가능한 모든 샘플을 나열하십시오.
2. 표본 평균을 계산합니다. nCr 표본 평균을 얻습니다 (여기서는 20c5 = 15504 평균).
3. 그들의 평균은 인구 평균과 같습니다. 표본 평균의 표준을 구합니다.
4. 표본 평균의 평균값과 표준값을 사용하여 표본 평균의 z 점수를 찾습니다.
5. z를 오름차순으로 정렬하고 z가 nCr z 값 범위 내에있을 확률을 찾으십시오.
6. 값을 일반 테이블과 비교하십시오. 작은 n은 손 계산에 좋습니다. n이 클수록 일반 테이블 값의 근사값이 더 가깝습니다.

다음 코드는 r에 있습니다.

n <- 20  
r <- 5  

p <- sample(1:40,n)  # Don't be misled!! Here, 'sample' is an r function  
                     used to produce n random numbers between 1 and 40.  
                     You can take any 20 numbers, possibly all different.  

c <- combn(p, r)     # all the nCr samples listed  
cmean <- array(0)  

for(i in 1:choose(n,r)) {  
    cmean[i] <- mean(c[,i])  
                }  

z <- array(0)  
for(i in 1:choose(n,r)) {  
    z[i] <- (cmean[i]-mean(c))/sd(cmean)  
                }  

ascend <- sort(z, decreasing = FALSE)  

z와 0 사이의 양의 값 q 사이의 z의 확률; 알려진 테이블과 비교하십시오. 아래에서 q를 0과 3.5 사이에서 조작하여 비교하십시오.

q <- 1  
probability <- (length(ascend[ascend<q])-length(ascend[ascend<0]))/choose(n,r)   
probability   # For example, if you use n=30 and r=5, then for q=1, you  
              will get probability is 0.3413; for q=2, prob is 0.4773

3
이 방법으로 샘플링을 사용하여 테이블을 생성하는 방법을 알 수 없습니다. 나는 영업 이익은 단지 첫 번째 사람이 누구인지 알고 싶어 생각
마이클 Chernick

소중한 의견 감사합니다. Michael Chernick. 1) OP는 "컴퓨터가 등장하기 전에 어떻게 했을까? 나는 수천 명의 리만 총계를 손으로 계산하는 무차별 한 사람을 떠 올리려한다."고 말했다. 나는 그 부분에 대답하려고 노력했다. 2) '샘플'이라는 용어는 샘플 자체가 아니며 임의의 숫자 목록을 생성하는 r 함수입니다. 대신 20 개의 숫자 만 사용할 수 있습니다. 여기에서 지원 r 링크를 참조하십시오 stackoverflow.com/questions/17773080/…
Md Towhidul Islam
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.