ntp에도 불구하고 스위치 중 하나가 어떻게 2 분 동안 꺼 집니까?


11

난 그냥 내 시스코 4500 스위치 중 하나는 시계가 잘못가는 것을 순수 우연히 발견 : 그것은이다 뒤에 2 분 이상 겉으로 기능 NTP에도 불구하고있다. 제 생각에는 1 초조차도 관련된 시스템에 허용되는 것으로 간주되어서는 안됩니다. 또한 진단과의 차이를 눈치 채지 못했을 것입니다. 단순한 벽시계와 비교하지 않았다면.

일부 세부 사항

다음은 부분적으로 대체를 서로 참조하는 일부 호스트 (10.0.99.1, 10.0.99.2, 10.0.1.119, 10.0.99.241)에 대한 ntp 정보이지만 주로 10.0.0.1과 동기화하여 다시 가져옵니다. 외부에서 시간. 따라서 시간 불일치는 원래의 다른 시간 원본으로 인해 발생할 수 없습니다. 관찰은 나를 다소 편집증 만든, 다음과 같은 의미에서 "정확한 시간을 갖고" show clock(나 date) (벌금에 따라 내 벽 시계와 내 로컬 시스템 클럭과 일치하는 출력 생산 http://time.is을 함께를) 확실히 1 초 미만의 오류 (현지 시계를 보면서 ENTER를 누르는 정확도)

10.0.1.119 (우분투)에 정확한 시간이 있습니다

$ ntpq -np
     remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
+10.0.99.1       10.0.0.1         3 u  855 1024  377    0.904   -2.658   0.113
*10.0.0.1        130.149.17.8     2 u  266 1024  377    0.253    0.909   0.127

10.0.99.241 (Cisco 2960)의 시간이 정확합니다

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
*~10.0.99.1       10.0.0.1         3     28     64   377  1.462  85.288 19.758
+~10.0.99.2       10.0.1.119       4     29     64   377  1.297  83.515  5.369
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

10.0.99.2 (Cico 4500)의 시간이 정확합니다

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
+~10.0.99.1       10.0.0.1         3      6   1024   111  1.148  -1.618 42.875
*~10.0.1.119      10.0.0.1         3     31   1024   377  0.043   1.687  1.064
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

10.0.99.1 (Cisco 4500)이 약 2 분 6 초 뒤쳐 짐

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
*~10.0.0.1        130.149.17.8     2    274   1024   377 15.625   3.681 30.403
+~10.0.99.2       10.0.1.119       4    415   1024   376 15.625   0.855 33.276
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

#sho ntp status 
Clock is synchronized, stratum 3, reference is 10.0.0.1      
nominal freq is 250.0000 Hz, actual freq is 249.9988 Hz, precision is 2**6
reference time is DAD8B428.54C6BAEA (20:36:24.331 MESZ Sat May 7 2016)
clock offset is 3.6818 msec, root delay is 32.80 msec
root dispersion is 71.74 msec, peer dispersion is 30.40 msec
loopfilter state is 'CTRL' (Normal Controlled Loop), drift is 0.000004720 s/s
system poll interval is 1024, last update was 683 sec ago.

질문

  1. 10.0.99.1은 어떻게 지금까지 떨어져 있습니까?
  2. 10.0.99.1에 동기화 된 시스템은 어떻게 정확합니까?
  3. sho ntp status10.0.99.1 의 출력 에서 클럭이 실제로 완전히 동기화되지 않았다는 것을 어떻게 알 수 있습니까 ( 에서 언급 한 모든 호스트 및 참조 클럭과 비교 sho ntp asso)? 나에게 결과는 매우 정교한 "나는 완전히 행복해"처럼 보인다.

편집 : 인기있는 수요에 의해sho clock detail

10.0.99.1

#sho clock detail 
13:06:38.605 MESZ Tue May 10 2016
Time source is NTP
Summer time starts 02:00:00 MEZ Sun Mar 27 2016
Summer time ends 03:00:00 MESZ Sun Oct 30 2016

10.0.99.2

#sho clock detail 
13:10:54.083 MESZ Tue May 10 2016
Time source is NTP
Summer time starts 02:00:00 MEZ Sun Mar 27 2016
Summer time ends 03:00:00 MESZ Sun Oct 30 2016

IP 주소가 각 장치에서 사용하는 ntp 서버로 구성한 시스템을 발견 할 수 없습니다. 그리고 서로 ntp 서버로 사용하는 루프뿐만 아니라 루프를 발견했습니다. 이 경우 서버가 아닌 ntp 피어로 지정해야한다고 생각합니다. 피어 또는 서버로 지정하든 정확히 어떤 차이가 있는지는 알지 못합니다. 또한 모든 것이 단일 호스트 ( 10.0.0.1)를 통해 동기화되도록하는 것이 좋습니다 . 그러나 나는 내 관찰 중 어느 것이 현재 문제의 원인을 직접 설명 할 수 있다고 생각하지 않습니다.
kasperd

2
ntp 구성에서 눈에 띄는 문제 중 하나는 각 호스트가 최악의 시간 소스로 구성되어 있다는 것입니다. "하나의 시계를 가진 사람은 현재 시간을 알고 있습니다. 두 개의 시계를 가진 사람은 확실하지 않습니다 ..."다른 숫자는 2보다 낫습니다. 4는 아마도 최선의 선택 일 것입니다. 세 가지 소스.
dfc

4
전체 NTP 구성을 재고해야합니다. 지층으로 작업해야합니다. @kasperd가 지적했듯이 루프에 문제가있을 수 있습니다. 계층 수준이 낮은 서버에만 동기화해야하며 계층 수준이 같은 서버는 피어링 할 수 있지만 서로 서버로 사용해서는 안됩니다. 피어링 된 장치는 여전히 신뢰할 수있는 소스로 하위 계층의 하나 이상의 서버가 필요하지만 다른 피어와의 연결을 시도합니다. 사용중인 장치 (예 : 코어 스위치)를 NTP 서버로 사용하지 마십시오.
Ron Maupin 2016 년

3
매우 이상한 일이 일어나고 있습니다. 모든 ntp 출력은 합리적으로 정상이며 동기화가 양호합니다. 그러나 장치에서 시간을 가져라는 명령에 따라 시간이 지났습니다. 그것은 어떤 이유로 든 시간이 꺼져있는 장치가 ntp 하위 시스템에서 시스템 시계를 설정하지 않는다는 것을 암시합니다.
David Schwartz

1
실제로 버그를 발견 한 것처럼 들릴 것입니다. 아마도 앞으로 나아갈 수있는 유일한 방법은 다시 부팅하여 사라지거나 Cisco에 연락하기를 희망하는 것입니다.
derobert

답변:


2

원래 원인이 여전히 불분명하기 때문에 이것을 답변으로 게시하는 것을 꺼려합니다. 그럼에도 불구하고 문제는 적어도 지금은 해결 된 것으로 보입니다.


htm11h 의 의견에 따라 펌웨어를 업데이트하기로 결정했습니다. 실제로 최신 펌웨어로 실행 중이므로 시계가 정확한 시간과 일치하는 것 같습니다.

그러나 이것이 새로운 펌웨어가 해결책이라는 것을 의미합니까? 불행하게도. 새 펌웨어를 처음로드 할 때 여전히 공장 출하 상태 인 구성 레지스터를 변경하는 것을 잊었습니다. 따라서 첫 번째 재부팅은 라우터가 거의 4 년 동안 (예 : 초기 전원을 켠 후) 실행 한 것과 동일한 원본 ROM 이미지로 끝났습니다. 그러나 이것은 시계가 한 번 큰 조정을 한 다음 동기화 상태를 유지하기에 충분했습니다. 이것은 재부팅만으로 일시적으로 도움이되었을 수 있음을 나타냅니다. 결과적으로 최신 펌웨어로 표시되는 정확한 시간이 앞으로 몇 년 동안 ntp 시간에서 벗어날 수 있습니다. 시계가 하루에 약 5 초 잃어 버렸는지 여부를 안전하게 알 수있을 때까지 며칠이 걸릴 것입니다 ...

지금은 사건이 종결되었습니다.


1

나는 90 년대 중반부터 NTP 풀 프로젝트로 많은 작업을 해왔으며 여기에서 여러 NTP Stratum-1 GPS 동기화 서버를 운영하고 있습니다. 다른 사람들이 말했듯이 시간을 얻으려면 두 대 이상의 서버가 필요합니다. 나는 보통 Ron Maupin이 위에서 언급 한 이유로 4를 사용합니다. 또한 나열된대로 루프를 찾아 서버 대 피어로 설정해야합니다.

시간 드리프트는 ntp.drift가 올바르게 삭제 또는 업데이트되지 않아 드리프트 문제를 처리하는이 IOS 업데이트에서 수정 된 IOS의 알려진 버그로 인한 것일 수 있습니다. 또한 재부팅이나 업데이트가없는 4 년은 IOS 보안 업데이트가 상당히 자주 나오기 때문에 현명한 보안 수준을 유지해야합니다.

다음은 Cisco IOS에서 NTP를 설정하는 훌륭한 게시물입니다. http://packetlife.net/blog/2011/mar/28/cisco-ios-clocks-and-ntp/

이것이 도움이 되길 바랍니다. 더 궁금한 점이나 문제가 있으면 문의하십시오.


0

전체 공개 : 나는 때때로 스위치 설정을 피할 수 없었으며, NTP 전문가는 아닙니다.

즉, RHEL 5.x 시스템에서 NTP 데몬을 보았습니다 (예, 돌아가고 있지만 스위치에 ~ 4 년 된 이미지가 있다고 말했듯이 ...)는 "행복한"상태에 빠졌습니다. , 그것이 완벽하게 동기화되었다고 생각되는 것처럼 보이지만 분명히 그렇지 않았습니다. ClusterSSH 세션을 사용하여 모든 시스템에서 "날짜"를 동시에 실행하면 시스템간에 5 분 정도의 드리프트가 발생하는 경우가 있습니다. 올바르게 기억한다면 데몬을 다시 시작해야만 문제를 해결할 수 있었고 궁극적으로 매일 밤 cron이 서비스를 다시 시작하도록 만들었습니다 ...

이상적인 솔루션은 아니지만 스위치에 연결하고 재부팅을 시작하거나 스위치에서 NTP 데몬을 "차기"하기 위해 cron 작업과 유사한 접근 방식을 채택 할 수 있습니까?

도움이 되었기를 바랍니다!

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.