같은 건물 내에서 서버 이동


61

시나리오는 다음과 같습니다. 저는 사무실에있는 서버 3 대를 물려받은 개발자입니다. 또한 서버 관리 지식이 부족하고 Google / ServerFault가 기준점으로 서버 관리자 역할을 상속 받았습니다. 운 좋게도 실제로는 기계와 물리적으로 접촉하거나 항상 '방금 작동 한'문제를 해결 한 적이 없었습니다.

세 머신 모두 동일한 데이터 룸 내에 있으며 다음과 같은 용도로 사용됩니다.

Machine1-많은 내부 응용 프로그램을 호스팅하는 IIS 8.0-내부 응용 프로그램을
Machine2위한 SQL Server 2008 R2 데이터 저장소
Machine3-SQL Server 2008 R2 미러 저장소Machine2

세 곳 모두 외부 하드 드라이브가 연결되어 있으며 자주 백업됩니다.

세 곳 모두 동일한 건물 내에서 한 데이터 실에서 다른 데이터 실로 이동해야한다는 알림을 받았습니다. 하드웨어의 물리적 이동을 완료하지 않을 것인데, 이는 유능한 이동자가 처리합니다.

각각의 전체 백업을 완료하는 것 외에도 전원 스위치를 가상으로 튕겨 내 세상이 움직이는 것을보기 전에 고려해야 할 사항은 무엇입니까?

나는 3 개가 모두 같은 방 / 건물에있는 것이 이상적이지 않다는 것을 알고 있지만이 질문의 범위를 벗어났습니다.


3
이 움직임과 관련이 없어도 이미 하나 또는 모든 마더 보드 / 전원 공급 장치 / 디스크가 죽으면 어떻게 할 계획이 있습니까? (결국 일어날 수 있기 때문에)
Dusan Bajic

5
@spuder는 인터넷없이 사용할 수있는 앱이 필요하거나 (내부 응용 프로그램이라고 함) NSA가 엿보기를 원하지 않을 것입니다. 클라우드는 불릿이 아닙니다.
André Borie

27
이것만으로는 충분하지 않지만 이동하기 전에 소프트 파워 다운 및 파워 업을 수행하여 서버의 전원을 성공적으로 켤 때 서버가 수행하는 작업을 알도록 제안합니다. 이전에 서버의 전원을 껐다 켜지 않은 경우 무시할 수없는 무서운 경고음이나 무시할 수있는 오류 메시지가있을 수 있습니다. 부드러운 파워 온의 모양과 소리가 얼마나 오래 걸리는지, 그리고 얼마나 오래 걸 렸는지 알면 이동 후 무언가가 잘못되었는지 판단 할 수있는 좋은 위치에있게됩니다.
Stefan Mohr

2
각 머신을 차례로 재부팅하고 이동하기 전에 오류없이 다시 작동하기를 바랍니다!
Matt

7
@Matt는 최소한 단서가 없다는 것을 인정하고 좋은 점을 배우려고 노력합니다. 나는 관리자가 완전한 바보이지만 너무 잘 모르는 경우를 너무 많이 보았습니다.
André Borie

답변:


61

진정으로 흥미로운 질문, 잘 물어 :)

이 동작을 수행하기 전에 확인해야 할 몇 가지가 있습니다.

전원 -새 룸에 적절한 양의 전원 콘센트가 있는지, 물리적 커넥터 유형에서와 같이 올바른 유형인지 확인하고, 현재 위치에서 서버마다 다른 전원 단계를 허용하여 단상 오류로부터 보호하는지 확인하십시오. 새 위치에서도이를 복제 할 것을 강력히 권장합니다.

냉각 -과열 및 서버 종료를 초래할 수있는 즉각적 또는 점진적인 열 축적이 없는지 확인해야합니다. 일반적으로 제조업체 웹 사이트에서 각 서버가 끌어낼 수있는 최대 전력 (와트) 또는 열 (BTU)을 조회 할 수 있습니다. 건물 관리자에게이를 알려주고 해당 위치의 냉각에 대처할 수 있다는 서면 확인서를받습니다. .

네트워킹 -이것은 어려운 일입니다. 이전과 새로운 위치간에 동일한 수의 포트를 복제해야 할뿐만 아니라 유형, 속도 및 가장 중요한 구성도 마찬가지입니다. 이 마지막 요점은 핵심입니다. 네트워크의 거의 모든 포트가 거의 동일한 시간이있었습니다. 그 시간을 기억할만큼 오래되었습니다! 그러나 요즘에는 포트 구성의 수와 하나의 포트가있을 수있는 네트워크의 장소가 천문학적이므로 네트워크 사람들이 모든 것을 동일하게 복제하도록해야합니다. 쉽지 않습니다. 이 움직임에 문제가 생기면 돈을 넣어 네트워크 포트에 동일하지 않을 것입니다. 항상 발생합니다.

'기타 연결' -서버에 전원 및 네트워킹 이외의 다른 연결이 있는지 알고 있습니까? 공유 스토리지에 대한 파이버 채널 링크, 공유 관리 화면에 대한 KVM 링크가 있습니다. 다시 동일하게 복제해야하는 경우가 있습니다.

그 외에는 더 구체적인 질문이 있으시면 언제든지 다시 방문하십시오.


2
Chopper3의 경우 +1-또한 네트워크 구성 방법에 따라 네트워크 카드의 MAC 주소가 이전 스위치에서 해제되지 않고 방법에 따라 인터넷이 작동하지 않을 가능성이 적습니다. 네트워크가 구축되었습니다. 스위치가 올바르게 구성되어 있으면 이런 일이 발생하지 않을 수도 있지만 대규모 환경에서 일한 경우가 많으며 네트워크 엔지니어가 수동으로 MAC 항목을 지워야했습니다.
Mugurel

4
분해하기 전에 후면 판 사진을 찍습니다. 고통을 덜어줍니다.
Sobrique

1
모두. 카메라 폰에서 모든 케이블이 연결되는 위치와 연결되어있는 것과 그렇지 않은 것을 사진으로 찍기 만하면됩니다. (DC에있는 것을 허용한다고 가정). 사악한 일이 발생하면 나중에 어떻게 '사물'이 있었는지 다시 확인하는 것이 좋습니다.
Sobrique

2
아, 그래서 '포트'-백플레인은 종종 완전히 다른 것을 말합니다
Chopper3

2
@ Chopper3 백플레인은 항상 내부 하드웨어 구성 요소를 의미하며 결코 "서버 케이스 뒷면"이 아닙니다. 그것이 실패한 소셜 네트워크를 의미하는 경우를 제외하고.
Christopher Schultz

27

다른 답변은 이동의 기술적 측면을 다룹니다. 다른 것들도 고려해야 할 수도 있습니다.

이동 중에 응용 프로그램이 다운 될 것임을 사용자에게 알리십시오. 근무 시간 외에 근무 시간을 예약하여 영향을받는 사람들의 수를 최소화하려고합니다.

서버를 가동 한 후 지식이있는 사람 (들)이 응용 프로그램을 테스트하도록하십시오. 응용 프로그램이 예상대로 작동하는지 확인하기 위해 위생 검사를 수행하도록합니다.

테스트 후 이동이 완료되었음을 사용자에게 알리고 문제가 있는지 알려주십시오.


18

우리의 형식에 대해“너무 광범위하다”는 말과 경계는 매우 어렵다. 확인해야 할 가장 중요한 것은 동일한 주소로 계속 실행될 수있는 방식으로 네트워크를 재구성해야하는 경우입니다. 동일한 주소를 유지할 수 있더라도 DHCP를 통해 구성되지 않았는지 확인하거나 새 위치에서 DHCP 서버를 사용할 수 있는지 확인하십시오.

참고 : 이미 언급했듯이 SQL 서버와 미러 서버를 갖는 것은 이상적이지 않습니다. 그러나 백업 드라이브를 같은 위치에 두는 것은 실제로 위험합니다. 다른 물리적 위치에 백업이 있어야합니다.


7
백업 +1 그들은 같은 위치에 있지 않아야하며, 백업 된 서버는 백업 미디어에 액세스 할 수 없어야합니다. 지금은 예산이 없을 수도 있지만 꼭해야 할 일 목록에 넣으십시오.
sdkks

16

다른 답변에는 이동 전 고려 사항이 있습니다. 그러나 실제 이동을 구성하는 방법도 계획해야합니다. Machine3Machine2 의 미러 라는 사실 때문에 가동 시간이 SQL Server 2008 R2 데이터베이스에서 중요한 고려 사항 인 것처럼 보입니다. 그것이 거울이라는 사실은 당신에게 기회를 제공합니다. 기본 서버가없는 경우 미러가 존재하는 이유를 사용할 수 있습니다. 여기에는 이동으로 인한 유지 보수로 인해 사용할 수없는 것이 포함됩니다.

계획을 세우십시오 :
이사가 어떻게 진행될 것인지에 대한 서면 계획을 세워야합니다. 작업의 일부 (예 : 이동자)를 처리하는 사람들에게이 계획 또는 그 일부를 제공해야 할 수도 있습니다. 이 계획에는 모든 이동 전 활동, 실제 이동 및 이동 후 조치 (예 : 기능 검증)가 포함되어야합니다.

기본 이동 :

  1. Machine3 이동 (SQL Server 미러) : 완전히 작동하십시오. 재 동기화를 확인하십시오.
  2. Machine2 이동 : 완전히 작동합니다.
  3. Machine1 이동 : 완전히 작동합니다.

이동에 대한 자세한 설명 :

다음은 Machine3 을 사용하여 Machine1 및 / 또는 Machine2에 대한 연결을 테스트하는 두 가지 방법 (경로 A 및 B)을 포함 합니다. 한 가지 방법 만 사용해야합니다. 이를 수행하는 방법 또는 사용하는 방법은 문제에 포함되지 않은 정보 (예 : 최종 시스템 위치의 물리적 분리, 시스템의 물리적 크기, 네트워크 / 전원 코드 길이, 연장 가능 여부, 네트워크 포트 구성의 유사성, 가동 시간 요구 등). Machine3 을 사용하여 이러한 연결을 테스트하면 Machine2 , 특히 미러가없는 Machine1의 가동 시간이 길어질 수 있습니다 . 방법 중 하나를 사용하거나 둘 다 사용하지 않도록 선택할 수 있습니다.

  1. Machine3을 먼저 이동하십시오 .

    • 지금은 Machine1Machine2 를 그대로 두십시오 .
    • Backup Machine3 을 종료 한 다음 종료
    • Machine3을 완전히 새로운 위치로 옮기 십시오 .
    • [경로 B :. 당신이 선택 단계 # 2를 사용하려는 경우 사용하지 않음] 모든 기계에 대한 네트워크 및 전원 구성이 동일한 경우 : 넣어 머신 3 머신 1을 위한 연결 사용하게 계획되어 머신 1을 .
    • 가져 오기 머신 3를 하고 실행 다시. 새 위치에서 Machine2 의 미러로 정상적으로 작동하는지 확인하십시오 . 이렇게하면 모든 문제 (전원, 네트워크 등) 구성이 새 위치에서 작동하는지 물리적으로 확인할 수 있습니다.
    • 발생하는 모든 문제를 해결하십시오.
    • 진행하기 전에 Machine3Machine2 와 완전히 다시 동기화 되었는지 확인하십시오 .
  2. 경로 A : (선택 사항) :

    • Machine3 을 사용 하여 Machine2Machine1을 위한 모든 기능을 테스트 하십시오 .
    • Machine3을 종료 하고 Machine2 의 위치 / 연결을 사용하여 (재 동기화 확인), Machine1 (재 동기화 확인 )으로 이동 / 전환하십시오 . 이 작업을 계획 한 경우 Machine3Machine1 또는 Machine2의 최종 사용을위한 연결로 처음 설정 되었으므로 Machine3 의 최종 위치에서 먼저 설정하지 않고 3 회만 변경하면됩니다. 2 다른 기계 중 하나의 기능을 사용하여 시작합니다.
    • 진행하기 전에 Machine3Machine2 와 완전히 다시 동기화 되었는지 확인하십시오 .
  3. Machine2를 이동하십시오 .

    • Machine3으로 연습 하면 훨씬 매끄럽게됩니다.
    • Backup Machine2 를 종료 한 다음 종료하십시오
    • Machine2 를 새 위치로 이동 하십시오. 모든 연결을
    • 발생하는 모든 문제를 해결하십시오.
    • 진행하기 전에 Machine2Machine3 과 완전히 다시 동기화 되었는지 확인하십시오 .
  4. [경로 B : 선택적 단계 # 2에서 Machine3 과의 모든 연결을 테스트 한 경우 필요하지 않음 ] 이제 Machine1 이 끝나는 Machine3이 있는 경우 :

    • 머신 종료 3 .
    • 종료하려는 위치로 이동하십시오 ( Machine1 의 위치를 ​​벗어난 위치).
    • 발생하는 모든 문제를 해결하십시오.
    • 진행하기 전에 Machine3Machine2 와 완전히 다시 동기화 되었는지 확인하십시오 .
  5. Machine1을 이동하십시오 .

    • Machine2Machine3을 모두 이동 한 후 ( Machine3 이 일시적으로 사용 하여 Machine1 이 사용할 실제 연결을 테스트 했으면 ), 이것이 가장 원활한 이동이어야합니다.
    • Backup Machine1 을 종료 한 다음 종료
    • Machine1 을 새 위치로 이동 하십시오. 모든 연결을
    • 발생하는 모든 문제를 해결하십시오.
    • Machine1 이 차지하는 위치에있는 설비에 문제가있는 경우 이제 Machine3 이 있는 설비를 사용할 수 있습니다. 바라건대 Machine3 에서 이미 한 시간 동안 사용하여 (Path A 또는 Path B) Machine1 위치의 모든 기능을 이미 테스트 할 수 있었으면 합니다.

7

서버의 IP가 변경되고 DNS 확인을 통해 SQL 상자에 연결되면 이동과 동시에 DNS 레코드 변경을 예약해야합니다.

인트라넷 소프트웨어 및 데이터베이스에 대해 알아야 할 사항 :

  • 인트라넷 소프트웨어가 IP, NetBIOS 또는 DNS를 통해 SQL Server에 연결됩니까?
  • 인트라넷 소프트웨어에서 사용하는 SQL Server 사용자 계정에 인증이 IP에서 들어오는 트래픽으로 제한됩니까?
  • 회사의 직원이 스프레드 시트 또는보고 도구에서 직접 SQL Server에 액세스합니까? 그렇다면 DSN을 어떻게 정의합니까?

정확히 동일한 IP를 얻지 못하거나 다른 서브넷에 연결되면 SQL Server에 연결된 모든 앱의 소스 코드 또는 구성 파일을 변경하기 위해 액세스해야합니다. 사람들은 임시보고를 위해 문서화되지 않은 직접 SQL 액세스에 의존 할 수 있습니다.


2

"재해 복구"서버를 활용하십시오. 프로덕션 서버를 이동하는 동안로드를 처리하도록 이들로 전환하십시오. 올바르게 구성된 DR 장비를 사용하면 가동 중지 시간 (최대 15 분)을 보지 않고 하루 중반에 이동할 수 있습니다. 재해 복구 서버는 프로덕션 서버와 동일한 방식으로 구성되어야합니다. DR 장비가없는 경우 장비를 구입하는 것이 좋습니다.

이런 식으로 생각하십시오 : 코르벳 함이 조정되는 동안 미니 밴을 사용하여 하루를 마무리하십시오.


6
서버가 3 개인 경험이없는 관리자를 놀라게하는 회사에 대해 많은 것을 가정하고 있습니다.
RoadieRich

물론 완벽하게 작동하는 서버 랩을 가정하고 있습니다. 또는 최소한 오래된 서버 (또는 PC)가 여전히 먼지를 모으는 장소에 있습니다. 이동을 수행하도록 다시 구성하십시오.
Software_Programineer

1

내가 언급하지 않은 한 가지는 새로운 서버 홈의 물리적 보안입니다. 이전에는 어떤 방을 사용했으며 누가 열쇠를 가지고 있습니까? 적절한 보안 (알람 시스템, 카메라 등)이 있습니까?


1

다른 답변 외에도 몇 가지 고려 사항 :

  • 응용 프로그램이 파일 또는 웹 서비스를 사용하여 야간에 데이터를 교환하는 등 다른 응용 프로그램에 연결되어 있습니까? 응용 프로그램을 사용할 수없는 경우 어떤 결과가 있습니까? 관련 응용 프로그램이 이에 대처할 수 있습니까? 아니면 응용 프로그램의 정보 부족으로 인해 실패하거나 잘못된 결과를 초래할 수 있습니까?

  • 사용자, 회사 또는 고객에게 가동 중지 시간이 허용됩니까? 얼마나 걸립니까?

  • 롤백 계획을 세우는 것이 좋습니다. 네트워크 문제와 같이 빠르게 해결할 수없는 문제가 발생하면이를 사용할 수 있습니다. 하드웨어를 다시 가져 오는 경우에는 무버를 계속 사용할 수 있어야합니다.

  • 응용 프로그램이 네트워크 트래픽을 많이 발생시키고이를 위해 네트워크를 준비해야합니까 (주소 및 방화벽 문제보다 훨씬 더 문제가되지는 않습니까)? 실시간 응용 프로그램 (예 : 화상 회의 소프트웨어)이있는 경우 대기 시간이 중요합니다.

  • 서버가있는 경우 서버가 서버 랙에 맞아야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.