CentOS 서버에서 하드 디스크 오류 / 실패 징후 확인


14

CentOS에서 HDD 오류 및 조기 장애 징후를 확인하는 가장 좋은 방법은 무엇입니까?


1
수표는 얼마나 자주해야합니까? 매일-매주?
inac

답변:


3

smartmon ( http://sourceforge.net/apps/trac/smartmontools/wiki )을 컴퓨터에 설치하는 것이 좋습니다. 이 소프트웨어는 디스크의 상태를 검사하고 그렇지 않으면 / var / log / messages 또는 scsi 오류에 대한 언급은 / var / log / syslog


smartmon은 그것의 통계에 따르면 고장난 드라이브의 60 % 만 잡을 것이라고 언급하지만, 매일 스캔하도록 smartmon을 설정하면 실제로 hdd가 더 빨리 죽는 데 도움이됩니까? 시게이트 7200.10입니까?
inac

@inac smartmon은 hdd가 더 빨리 죽는 데 도움이 될까요? 어디서 읽었습니까? URL을 추가하십시오.
030

2
dmesg

커널은 I / O 장치에 대한 진단 메시지를 기록하므로 dmesg 명령으로 해당 메시지를 확인할 수 있습니다.


하지만 수동으로 또는 cronjob dmesg 덤프를 vi로 실행해야합니까?
inac

어느 한 쪽. "dmesg> dmesg.dump.txt"로 스크립트를 덤프하고 매일 cron을 사용하여 스크립트를 실행할 수 있습니다.
Banjer

1

장치에서 fsck를 실행하여 오류를 확인할 수 있습니다.


0

Paul이 말했듯이 SMART 로그는 확인하기에 좋은 장소입니다.

또한 BadBlocks를 실행하는 것이 좋습니다 . RAID 카드가있는 경우 해당 모니터를 사용해야 할 수도 있습니다.


0

스마트 모니터링은 좋은 방법입니다. 루트로 smartctl -a /dev/hda, 여기서 hda는 원하는 드라이브입니다 ... hdb, sda 등일 수 있습니다. 또한 루트 메일을받을 사람으로 / etc / aliases에 전자 메일 주소를 설정하는 것이 좋습니다.

그것은 매우 모호한 답변입니다. 대기업 (Dell, HP 등)이 만든 서버가있는 경우 더 나은 모니터링 기능을 사용할 수 있습니다.


0

파티션 / dev / sda1의 전체 검사를 시도 할 수 있습니다 (예 :)

fsck -f /dev/sda1

또는 주어진 파티션에 대한 전체 쓰기 읽기 비파괴 테스트를 시도하십시오.

badblocks -vn /dev/sda1

/dev/sda1 is mounted; it's not safe to run badblocks!
030

e2fsck: Cannot continue, aborting.
030

@ 030 주 디스크가 마운트되지 않은 런레벨로 드롭하십시오.
awiebe
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.