의 자릿수가 통계적으로 무작위입니까?


33

시퀀스를 관찰한다고 가정하십시오.

7, 9, 0, 5, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 0, 6, 6, 4, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, 2, 0, 4, 5, 2, 8. ..

이것이 실제로 무작위인지 확인하기 위해 어떤 통계 테스트를 적용 하시겠습니까? 참고 로 의 번째 숫자입니다 . 따라서 숫자는 통계적으로 무작위입니까? 상수 에 대해 아무 말도하지 않습니까?π π ππππ

여기에 이미지 설명을 입력하십시오




10
이것은 흥미롭고 미친 질문입니다. 측정 이론적 확률에서 첫 번째 과정을 밟은 모든 학생은 "거의 모든"실수가 정상 임을 쉽게 증명할 수 있습니다 . 그러나 알려진 몇 가지 명백한 예가 있으며, (내가 아는) 지식으로는이 문제가 "유명한"비이성적 인 수학 상수에 대해 해결되지 않았습니다.
추기경

4
@ 추기경의 발언과 (엄격한) 연결에서 일반 수

6
그래프는 무엇입니까? 홀수 간격이 10 개이며 모두 10 % 이상의 값을 갖습니다!
xan

답변:



5

첫 번째 질문에 대한 답변 : "이 [순서] 가 실제로 무작위 인지 확인하기 위해 어떤 테스트를 적용 하시겠습니까?"

시계열로 취급하고 자동 상관 관계를 확인하는 것은 어떻습니까? 다음은 R 코드입니다. 먼저 일부 테스트 데이터 (처음 1000 자리) :

digits_string="1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989"
digits=as.numeric(unlist(strsplit(digits_string,"")))

각 숫자의 개수를 확인하십시오.

> table(digits)
digits
  0   1   2   3   4   5   6   7   8   9 
 93 116 103 102  93  97  94  95 101 106 

그런 다음 시계열로 바꾸고 Box-Pierce 테스트를 실행하십시오.

d=as.ts( digits )
Box.test(d)

그것은 나에게 말한다 :

X-squared = 1.2449, df = 1, p-value = 0.2645

일반적으로 자동 상관이 있다고 말하기 위해 p- 값이 0.05 미만이 되길 원합니다.

acf(d)자동 상관을 보려면 실행 하십시오. 가장 큰 지연이 11과 22에 있다는 것이 궁금하지만 이미지가 둔한 차트이므로 여기에 이미지를 포함시키지 않았습니다 acf(d,lag.max=40).


PS 우리는 실제 난수에 대해 동일한 테스트를 수행하여 1000 자리 pi의 성능을 비교할 수 있습니다.

probs=sapply(1:100,function(n){
    digits=floor(runif(1000)*10)
    bt=Box.test(ts(digits))
    bt$p.value
    })

이렇게하면 1000 개의 난수가 생성되고 테스트가 수행되며 100 회 반복됩니다.

> summary(probs)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
0.006725 0.226800 0.469300 0.467100 0.709900 0.969900 
> sd(probs)
[1] 0.2904346

따라서 우리의 결과는 첫 번째 표준 편차 내에서 편안하게 이루어졌으며 임의의 오리처럼 삐걱 거리는 소리입니다. ( set.seed(1)정확한 숫자를 재현하려면 사용했습니다 .)


0

이상한 질문입니다. 숫자는 무작위가 아닙니다.

π

0.1212121212

πππ2222+1ππ


π

π

2
나는이 대답을 실제로 따르지 않습니다. 예, pi는 고정되어 있지만 일련의 숫자는 여전히 일련의 임의의 숫자처럼 동작 할 수 있습니다. 0.1212가 어떻게 정의에 의해 무작위성을 나타내는 지 알 수 없습니다. 그리고 의견에서 지적했듯이, pi에 임의의 숫자 시퀀스가 ​​포함되어 있는지 여부는 임의의 숫자의 특성에 거의 영향을 미치지 않습니다. 그렇다면 왜 그것에 초점을 맞추고 있습니까?
핵 왕

π

@AdamO 당신은 당신이 묘사하는 숫자가 파이라는 것을 미리 알고 있다면 부정 행위처럼 보일 수 있습니다. 3.141592의 숫자는 다음 숫자가 6임을 나타내지 않습니다. 당신이 아는 유일한 방법은 pi를 구체적으로 설명하기 때문입니다. pi에서 N까지의 숫자를 이미 계산하지 않았다면 숫자 N이 특정 숫자가 될 것으로 예상 할 이유가 없습니다. 임의의 숫자 시퀀스와 같은 것은 없다는 것을 암시하는 것 같습니다. 일단 기록하면 고정되기 때문입니다.
원자력 왕
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.