특정 오프라인 수정 불가능한 섹터에 대해 현명하게 시스템을 종료하는 방법은 무엇입니까?


18

최근에는 "오프라인 수정 불가능 섹터"가 SMART 상태로 표시되는 2 디스크 소프트웨어 RAID-1에 디스크가 있습니다.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

이는 디스크가 점점 더 자주 발생하는 경우 임박한 디스크 오류의 징후 일뿐입니다 (드라이브가 미러링되므로 실제 데이터 손실 위험도 크지 않습니다). 그 당시 자체 테스트도 어느 시점에서 실패했으며 smartd당연히해야 할 일을 알려주는 이메일을 저에게 보냈습니다.

그러나 손상된 섹터에 쓰면 일반적으로 디스크가 여분의 섹터 중 하나를 대신 사용합니다. 디스크를 dd살펴본 후 모든 자체 테스트가 제대로 수행 되었기 때문 입니다. 또한 badblocks불평 할 이유가 없습니다.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

결함이있는 섹터의 수는 줄어들지 않았지만, 실제로는 깨진 섹터가 아직 남아 있기 때문에 사용되지는 않았지만 그렇게해서는 안됩니다. 그러나 smartd매일 밤 이메일을 계속 보내십시오.

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

이것은 분명히 매우 성가 시며 smartd메일에 대한 건강한 패닉 반사를 마비시킵니다 .

디스크는 Western Digital WD20EARS이고 smartd버전은 5.41 2011-06-09 r3365입니다.

답변:


23

일부 디스크에서는 구성 파일에서 -U 198+(또는 -U +?) 를 사용해야 할 수도 있습니다 .

조심하세요 원래 질문자가 아닌 경우 전체 질문을주의 깊게 읽으십시오. 이를 필요로하지 않는 디스크에서 이것을 사용하면 유효한 경고가 완전히 표시되지 않습니다.

"+"를 지정하면 마지막 확인주기 이후에 섹터 수가 증가한 경우에만 보고서가 인쇄됩니다. 불량 섹터가 재 할당 될 때 일부 디스크는이 속성을 재설정하지 않습니다. 아래“-v 198, 증가”를 참조하십시오.

smartd.conf (5)

예를 들어의 기본 구성을 사용한다고 가정합니다 smartd.conf. 이 경우 파일에 많은 주석이 있지만 주석이 아닌 유일한 줄은 다음과 같습니다.

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

줄 끝에 옵션을 추가하십시오.

DEVICESCAN -U 198+

1
-U 198+해야합니다. 좋은 발견!
Michael Hampton

이것에 대한 어떤 고환?
JIV

1
@JIV가 수정되었습니다. 나는 또한 경고를 추가했다. 귀하의 데이터에 모든주의를 기울이십시오 :-).
sourcejedi

0

이러한 메일은 두 가지 가능성이 있습니다. smartd는 자체적으로 메일을 보낼 수 있지만이 방법으로 구성되지 않았을 가능성이 높으므로 이러한 메일은 로그 확인으로 전송된다고 가정합니다. 이 가정이 틀리면 더 이상 읽을 필요가 없습니다.

logcheck는 로그 파일을 스캔하고 시스템에서 발생하는 모든 일에 대해 걱정해야한다고 생각되면 메일을 보냅니다.

특정 패턴과 일치하는 메시지를 보내지 않도록 logcheck에 지시하는 logcheck ignore 규칙을 작성하는 옵션이 있습니다.

데비안 기반 시스템에서 다음 내용으로 "/etc/logcheck/ignore.d.server/smartd_own"이라는 파일을 만들 수 있습니다.

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

이것은 성가신 메일을 걸러 내지 만 수정할 수없는 섹터 카운터가 증가하면 다시 쓰십시오.


smartd불행히도 메시지를 직접 보냅니다. 이것은 항상 이것을 변경하는 옵션입니다. 다른 방법이 없어야한다고 생각합니다. 그래서 감사합니다!
Christian

어쨌든, 이제 해결 방법이 있습니다.
hennr
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.