정규 분산 클록 부정확 한 보정


10

전 세계에 분포 된 수백 대의 컴퓨터에서 특정 이벤트의 발생을 측정하는 실험을 실시했습니다. 이벤트는 서로에 따라 달라 지므로 순서대로 증가한 다음 시차를 계산할 수 있습니다.

이벤트는 기하 급수적으로 분산되어야하지만 히스토그램을 플로팅 할 때 얻을 수있는 것입니다.

이벤트 히스토그램

컴퓨터의 시계가 정확하지 않으면 일부 이벤트에 종속 된 이벤트보다 시간 소인이 더 빨리 지정됩니다.

PDF의 피크가 0이 아니라고 (모든 것이 오른쪽으로 이동했다는) 시계 동기화가 비난받을 수 있는지 궁금합니다.

클럭 차이가 정규 분포 인 경우 효과가 서로를 보완하여 계산 된 시간 차이를 사용한다고 가정 할 수 있습니까?

답변:


13

클럭 동기화 문제로 인해 피크가 오른쪽으로 이동 될 수 있습니다. R의 다음 시뮬레이션은이 현상을 보여줍니다. 나는 모양 얻을 지수 시간과 정상 클럭 차이를 사용 대략 그림을 닮았다를 :

시계

왼쪽 분포 (오류없이 측정 된 실제 차이)는 0에서 최대 값을 갖는 반면, 오른쪽 분포 (오류로 측정 된 차이)는 최대 약 100입니다.

R 코드 :

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

클럭 차이가 평균 0 에서 정상 이면 차이가 관측 된 차이의 평균이 실제 차이의 평균과 같아야한다는 의미에서 상쇄되어야합니다. 이러한 경우인지 여부는 첫 번째 이벤트가 발생한 컴퓨터와 두 번째 이벤트가 발생한 컴퓨터간에 체계적인 차이가 있는지 여부에 따라 다릅니다.


4
+1 멋지게 보여줍니다. 수학적으로, 데이터는 오차 분포와 (추정 된) 지수 분포의 합에서 가져옵니다. 이 오류 분포를 추정하고 유혹 deconvolve 진정한 분포를 추정하기 위해 데이터를.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.