프로덕션 환경에서 실행되는 HP Gen9 서버의 MTTF, MTBF, MTBR 및 MTBF를 조사했습니다.
내 질문의 뿌리는 걱정해야합니다.
각 서버에 하드웨어가 혼합되어 있으므로 좋은 데이터를 얻을 수 없습니다.
마지막 회사에서 우리는 약 2000 대의 Dell 서버 r210 r410 r710을 실행했습니다. 평균적으로 하루에 약 5 대의 서버가 있었는데 일종의 장애가있었습니다. 따라서 서버의 약 0.25 %가 고장 나서 다시 사용할 수 있으려면 부품을 교체해야했습니다.
마지막 회사는 모든 것이 HA 쌍, N + 2 인프라로 설정되었으므로 프로덕션에는 영향을 미치지 않았습니다. 서버를 교체하고 계속 진행할 수있었습니다
현재 사무실에서 9 대의 서버를 운영하고 있습니다 (HP Gen9, 56 VM의 Hyper-V). 아무것도.
저의 CTO 나 IT 관리자는 작년에 약 2.5 일의 가동 중지 시간이 있었기 때문에 서버를 클러스터링해야한다고 생각했지만 필요를 보지 못했습니다.
여기에 잘못된 것이 있습니까? 무엇을해야할지 모르겠습니다.
CTO에 문제가 발생하면 책임이 아님을 알고 있습니다. 이 회사는 CTO, IT 관리자, 나 자신 (dev ops) 및 헬프 데스크 담당자 1 명만있는 매우 작은 회사입니다.
프로덕션 환경 실행에 대한 모든 경험을 통해 매우 제한적이며 많은 것들을 설정하는 방식은 매우 중학교 수준이라고 부릅니다. CTO 나 IT 관리자는 내가 가기 전에 클러스터링에 대해 많이 알지 못했습니다. 그들은 HA없이 DR을 설정하는 프로젝트의 한가운데에 있었고, 나는 반대했지만 잃었습니다.