오늘날 우리는 최악의 시나리오에 부딪 쳤으며 모든 종류의 좋은 아이디어에 개방적입니다.
우리의 문제는 다음과 같습니다.
여러 전용 스토리지 서버를 사용하여 가상 머신을 호스팅하고 있습니다. 계속하기 전에 사양은 다음과 같습니다.
- 전용 서버 머신
- Areca 1280ml RAID 컨트롤러, 펌웨어 1.49
- 삼성 1TB HDD 12 개
하나의 논리 볼륨을 포함하는 10 개의 디스크로 하나의 RAID6 세트를 구성했습니다. 시스템에 2 개의 핫 스페어가 있습니다.
오늘 하나의 HDD가 고장났습니다. 이것은 때때로 발생하므로 교체했습니다. 재 구축시 두 번째 디스크가 고장났습니다. 일반적으로 이것은 재미가 없습니다. 안정적인 RAID 재 구축을 위해 과도한 IO 작업을 중단했습니다.
슬프게도 핫 스페어 디스크가 재 구축되는 동안 실패하고 모든 것이 중단되었습니다.
이제 다음과 같은 상황이 있습니다.
- 컨트롤러는 공격대가 재건되고 있다고 말합니다
- 컨트롤러가 볼륨이 실패했다고 말합니다
RAID 6 시스템이고 두 개의 디스크가 고장 났으므로 데이터가 손상되지 않았지만 데이터에 액세스하기 위해 볼륨을 온라인으로 다시 가져올 수는 없습니다.
검색하는 동안 다음 리드를 찾았습니다. 그들이 좋은지 나쁜지 모르겠습니다.
모든 디스크를 두 번째 드라이브 세트에 미러링합니다. 따라서 우리는 이미 가지고있는 것보다 더 많이 잃지 않고 다른 일을 시도 할 수 있습니다.
R-Studio에서 배열을 다시 작성하려고합니다. 그러나 우리는 소프트웨어에 대한 실제 경험이 없습니다.
모든 드라이브를 꺼내고 시스템을 재부팅하고 areca 컨트롤러 BIOS로 변경 한 후 HDD를 하나씩 다시 삽입합니다. 어떤 사람들은 이것으로 시스템을 온라인 상태로 만들었다 고 말합니다. 어떤 사람들은 효과가 0이라고 말합니다. 어떤 사람들은 그들이 모든 것을 날려 버렸다고 말합니다.
"rescue"또는 "LeVel2ReScUe"와 같은 문서화되지 않은 areca 명령 사용
컴퓨터 법의학 서비스에 문의 하지만 우와 ... 전화로 1 차 추정치는 20.000 €를 넘었습니다. 우리가 친절하게 도움을 요청하는 이유입니다. 어쩌면 우리는 명백한 것을 놓치고 있습니까?
물론 그렇습니다. 백업이 있습니다. 그러나 일부 시스템은 1 주일 동안 데이터를 잃어 버렸으므로 시스템을 다시 시작하고 실행해야합니다.
도움, 제안 및 질문은 환영 이상입니다.
dd
모든 디스크 의 미러가 되어야한다고 생각합니다 . 실제 솔루션에서 작업 할 때 더 많은 손상을 막고 대체 계획을 세우기 위해서입니다.