고장난 하드 드라이브를 물리적으로 식별


25

서버에 6 개의 하드 드라이브가 있다고 가정 해 봅시다. 드라이브에 오류가 발생하거나 (탑재 / 감지하지 않고, 오류로 인해 급습 할 수 없음) 실패합니다 (SMART가 악화됨 등). 불량 드라이브를 교체해야합니다. 사건을 열면 6 개의 동일한 하드 드라이브가 나타납니다.

어느 것이 더 이상 건강 / 마운트 / 기능이 아닌지 어떻게 알 수 있습니까?

시스템은 가장 간단한 소프트웨어 RAID를 사용하는 리눅스, 우분투 서버 일 것입니다. 하드 드라이브는 SATA이며 마더 보드에 직접 연결됩니다. (공격 컨트롤러 없음)

올바른 드라이브를 선택할 때까지 드라이브를 임의로 분리하고 싶지 않습니다. 드라이브는 모두 나와 동일하게 보입니다. 내가 알지 못하는 드라이브를 식별하는 일반적인 방법이 있다고 생각합니다. 누구든지 포인터 / 팁 / 모범 사례가 있습니까? 감사!

편집 : 나는 이것을 손으로 물결 치는 방식으로 '일반화'하기를 원했지만 '불완전'과 '끔찍한'으로 나왔습니다. 내 잘못이야!


4
컴퓨터를 종료하고 어떤 하드 드라이브가 무엇인지 알아 내야하는 경우, 각 하드 드라이브를 식별하고 몇 가지 방식으로 레이블을 지정하기 위해 컴퓨터가 작동 중지 된 상태에서 시간을 가져야합니다. 발행물.
Roy Rico

2
"RAID (또는 무엇이든)"? 기계실 안에서 사용자가 느슨하게 들리는 것 같습니다.
romandas

1
적절한 서버는 불량 드라이브의 드라이브 오류 표시기를 켜서 어떤 드라이브를 알려줍니다.
John Gardeniers

8
모든 사람들이 이걸 속죄하는 것처럼 빨리 뛰어 올라 ... 솔직히 말해서 그것은 내가 스스로 다루어야했던 좋은 질문이라고 생각합니다!
Mark Henderson

2
취미 목적으로, 납땜 인두 등으로 드라이브 LED를 구성하여 임의의 OS 내에서 물리적으로 식별 할 수있는 신호 LED를 생성 할 수 있는지 궁금합니다 (서버 등급의 디스크 / RAID 컨트롤러가없는 경우) 그들의 마술을하기 위해 선물) ...
Oskar Duveborn

답변:


26

나는 당신이 설명하는 것처럼 (타워) 서버 에서이 정확한 문제를 겪었습니다.

smartctl은 드라이브의 일련 번호를 출력합니다

공급 업체는 때때로 hdparm과 같은 고유 도구를 제공하여 동일한 기능을 수행합니다.

따라서 불량 드라이브의 직렬을 출력 한 다음 치과 용 미러와 손전등을 사용하여 드라이브를 찾으십시오.

랙 마운트에는 일반적으로 다른 사람들이 말한 것처럼 표시등이 있지만 동일한 방식으로 적용됩니다.


내가 생각하는 것은 hdparm이 아닌 똑똑한 것입니다. 이를 반영하기 위해 답변을 편집해야합니다.
Bart Silverstrim

:-) 올바른 명령을 생각 나게하기위한 upvoted
바트 Silverstrim

1
hdparm -i는 드라이브의 일련 번호를 보여줍니다. 벤더별 응답 일 수도 있습니다.
Ian Clelland

1
우수한! 나는 지금 그것을 시도 할 수는 없지만 이것이 답인 것 같습니다! 이제 마운트하는 동안 노출 된 곳에 하드 드라이브에 일련 번호의 마지막 N 자리 (서버 당 고유 한 것으로 가정)를 레이블링합니다. 또한 명령 모습을 인터넷 검색에서 "smartctl -i"할 수
privatehuff

15

트레이 디자인에 따라 드라이브에 스티커를 부착하는 것이 불가능할 수 있습니다. 드라이브가 죽을 때까지 스티커가 마르거나 떨어질 수 있습니다.

ledctl (ledmon 패키지)은 실제로 이와 함께하는 방법입니다.

ledctl locate=/dev/disk/by-id/[drive-id]

또는

ledctl locate=/dev/sda

지정된 드라이브에 대해 섀시의 드라이브 오류 표시등이 켜집니다. 드라이브를 식별하는 방법이 중요하지 않음을 설명하기 위해 두 가지 예를 제공했습니다. 당신은 시리얼, 이름 등을 사용할 수 있습니다 ... 당신이 사용할 수있는 정보가 무엇이든 사용할 수 있습니다. 드라이브는 / dev / 및 / dev / disk / 경로에서 여러 가지 방법으로 참조됩니다.

라이트를 다시 끄려면 다음과 같이 locate_off로 locate를 변경하여 다시 실행하십시오.

ledctl locate_off=/dev/sda

6

일반적으로 연결에 어떤 방식으로 레이블이 표시되고 실패한 장치의 ID에서 작동하기를 희망해야합니다. 예를 들어 ... 누군가가 나를 고치려면 댓글을 달아야 할 것입니다 .2 개의 IDE 채널이 있고 각 채널에 최대 2 개의 드라이브가 있으면 sda, sdb, sdc 및 sdd를 가질 수 있습니다. sdd가 실패하면 두 번째 IDE 채널 케이블의 두 번째 드라이브가됩니다.

SATA이고 백룸에있는 시스템과 같은 포트는 각 sata 드라이브에 대해 레이블이 지정되어 있습니다. 다시, 드라이브 글자는 SATA 커넥터의 포트 0에서 시작하여 드라이브가 올라가는 모든 것을 통과합니다.

제조상의 차이가있는 경우 dmesg | grep sd 또는 dmesg | grep hd는 약간의 힌트를 제공해야합니다.

사용 가능한 일련 번호가 있으면 hdparm 명령이 소프트웨어에서 제공 할 수 있으므로 그렇게 추적 할 수 있습니다. 그런 경우 드라이브에 레이블을 지정하여 문제가있을 때 걱정할 필요가 없습니다.

... 소프트웨어 RAID보다 하드웨어 RAID를 선호하는 또 다른 이유가 있다는 것을 알고있었습니다. 깜박 거리는 불빛 처럼요

편집 : hdparm이 아닌 smartctl은 일련 번호를 제공합니다. 내 잘못이야.


깜박 거리는 조명 +1
Oskar Duveborn

3

일부 드라이브 /sys는 위치 표시등을 켜려면 1을, 끄려면 0을 에코 할 수 있는 위치 "파일"을 노출시킵니다 .

$ for light in $( find /sys -name "locate" ) ; do echo 1 > $light ; sleep 10 ; echo 0 > $light; done

나는 이것에 대해 전혀 몰랐다! 대단해!
diq

2

6 개의 내장 HDD? 외장 핫 스왑 드라이브 인 경우 핫 스왑 캐리어에 오류 표시등이있어 불량 드라이브를 식별하는 데 도움이됩니다. 또한 많은 Raid 관리 프로그램에는 어떤 드라이브를 결정하기 위해 특정 드라이브의 표시등을 플래시하는 옵션이 있습니다. 이들이 모두 내부 조명이없는 경우 RAID 소프트웨어를 사용하여 어떤 ID가 좋은지 알려주고 SCSI ID 등을 확인하여 파악합니다. 자동으로 설정된 경우 RAID 컨트롤러 설명서는 SCSI 체인에서 ID가 할당 된 순서를 알려줍니다. 행운을 빕니다. 작업이 계속 진행되는 동안 지금 백업하십시오!


2

최소한 고장난 드라이브에 대해 알려주는 RAID 소프트웨어 / 컨트롤러는 고장난 드라이브 (ID 번호)를 알려야합니다. 0은 일반적으로 왼쪽 위의 하나이며 아래로 이동 한 다음 오른쪽으로 두 개 이상의 열에있는 경우입니다. 포트에 레이블이 붙어있을 수 있습니다.



2

위치 표시등이없고 드라이브 외부에서 일련 번호를 쉽게 찾을 수없는 경우, 때때로이 치즈 테크닉이 도움이 될 수 있습니다. 특정 드라이브에서 많은 활동을 생성 한 후 활동 LED가 켜져있는 드라이브를 찾으십시오. . 일련 번호를보다 자세히 확인하는 것이 가장 좋지만 검색 범위를 좁힐 수 있습니다.

예 :

# while true; do dd if=/dev/disk/by-id/scsi-drive-that-is-dying of=/dev/null; sleep 1; done

while 루프는 기술적으로 필요하지 않지만 데이터 센터로 향하는 동안 계속 움직이게됩니다. "sleep 1"은 "dd"로 인해 "dd"가 실패하는 경우 빠른 루프로 인해 CPU 사용량이 높아지는 것을 방지합니다. 드라이브 연결이 끊어졌습니다.)


1

다른 모든 것이 실패하면 실패하지 않은 드라이브를 식별하고 역으로 작업 할 수 있습니다.

find / -type f -exec cat {} \; >> /dev/null

작동 표시등이 켜지지 않는 드라이브는 나빠질 수 있습니다 (단 하나만 가능합니다). 핫 스페어를 구성한 경우에도 표시되지 않습니다.


0

섀시에 레이블이 붙어 있고 RAID 소프트웨어와 일치해야합니다.

Dell의 생각에는 그렇지 않습니다. 우리의 0 : 0은 왼쪽 하단, 0 : 1은 왼쪽 상단, 0 : 2는 중간 하단 등입니다. 내가 사용한 모든 서버 (수제 작업 제외)에서 RAID 소프트웨어는 포트를 표시하며 포트는 라벨이 붙어 있습니다.


0

scsirastools 에는 SCSI 디스크에서 다양한 진단 테스트를 수행 할 수있는 도구 세트가 있습니다. sgmon을 사용하여 소프트웨어 제어 하에서 디스크 전원을 끌 수도 있습니다. 이것은 최소한 진단을 통해 찾을 수있는 물리 디스크를 식별 할 수있게합니다.

하드웨어 RAID 컨트롤러가있는 경우 컨트롤러의 BIOS 또는 관리 소프트웨어에는 불량 디스크를 식별 할 수있는 기능이 있어야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.