SMART 하드 디스크에 따르면 고장이 없지만 dmesg에 오류가 있습니다.


13

가끔 컴퓨터를 부팅하는데 이상한 문제가 있습니다 (데비안을 실행합니다). 그래서 "dmesg"명령을 내 렸습니다. 출력에서 많은 오류가 발생했습니다. 그러나 하드 디스크에서 "smartctl -t long / dev / sda"명령을 사용하여 확장 SMART 테스트를 실행하면 디스크가 손상되지 않습니다.

이러한 오류의 원인은 무엇입니까?

오류는 다음과 같습니다.

   (...)
      [  505.918537] ata3.00: exception Emask 0x50 SAct 0x400 SErr 0x280900 action 0x6 frozen
      [  505.918549] ata3.00: irq_stat 0x08000000, interface fatal error
      [  505.918558] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [  505.918566] ata3.00: failed command: READ FPDMA QUEUED
      [  505.918579] ata3.00: cmd 60/40:50:20:5b:60/00:00:0b:00:00/40 tag 10 ncq 32768 in
               res 40/00:54:20:5b:60/00:00:0b:00:00/40 Emask 0x50 (ATA bus error)
      [  505.918586] ata3.00: status: { DRDY }
      [  505.918595] ata3: hard resetting link
      [  506.410055] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [  506.422648] ata3.00: configured for UDMA/133
      [  506.422679] ata3: EH complete
      [ 1633.123880] md: bind<sdb3>
      [ 1633.187966] RAID1 conf printout:
      [ 1633.187977]  --- wd:1 rd:2
      [ 1633.187984]  disk 0, wo:0, o:1, dev:sda3
      [ 1633.187989]  disk 1, wo:1, o:1, dev:sdb3
      [ 1633.188866] md: recovery of RAID array md0
      [ 1633.188871] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
      [ 1633.188875] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
      [ 1633.188890] md: using 128k window, over a total of 1943618560k.
      [ 1634.167341] ata3.00: exception Emask 0x50 SAct 0x7f80 SErr 0x280900 action 0x6 frozen
      [ 1634.167353] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1634.167361] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1634.167369] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167382] ata3.00: cmd 60/00:38:00:00:6f/02:00:01:00:00/40 tag 7 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167389] ata3.00: status: { DRDY }
      [ 1634.167395] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167407] ata3.00: cmd 60/00:40:00:02:6f/02:00:01:00:00/40 tag 8 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167413] ata3.00: status: { DRDY }
      [ 1634.167418] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167429] ata3.00: cmd 60/00:48:00:04:6f/02:00:01:00:00/40 tag 9 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167435] ata3.00: status: { DRDY }
      [ 1634.167439] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167451] ata3.00: cmd 60/00:50:00:06:6f/02:00:01:00:00/40 tag 10 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167457] ata3.00: status: { DRDY }
      [ 1634.167462] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167473] ata3.00: cmd 60/00:58:00:08:6f/02:00:01:00:00/40 tag 11 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167479] ata3.00: status: { DRDY }
      [ 1634.167484] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167495] ata3.00: cmd 60/00:60:00:0a:6f/02:00:01:00:00/40 tag 12 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167500] ata3.00: status: { DRDY }
      [ 1634.167505] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167516] ata3.00: cmd 60/80:68:00:0c:6f/00:00:01:00:00/40 tag 13 ncq 65536 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167522] ata3.00: status: { DRDY }
      [ 1634.167527] ata3.00: failed command: READ FPDMA QUEUED
      [ 1634.167538] ata3.00: cmd 60/00:70:80:0c:6f/02:00:01:00:00/40 tag 14 ncq 262144 in
               res 40/00:6c:00:0c:6f/00:00:01:00:00/40 Emask 0x50 (ATA bus error)
      [ 1634.167544] ata3.00: status: { DRDY }
      [ 1634.167553] ata3: hard resetting link
      [ 1634.658816] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1634.672645] ata3.00: configured for UDMA/133
      [ 1634.672696] ata3: EH complete
      [ 1637.687898] ata3.00: exception Emask 0x50 SAct 0x3ff000 SErr 0x280900 action 0x6 frozen
      [ 1637.687910] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1637.687918] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1637.687926] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687940] ata3.00: cmd 60/00:60:80:a7:af/02:00:02:00:00/40 tag 12 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687947] ata3.00: status: { DRDY }
      [ 1637.687953] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687965] ata3.00: cmd 60/00:68:80:a9:af/02:00:02:00:00/40 tag 13 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687971] ata3.00: status: { DRDY }
      [ 1637.687976] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.687987] ata3.00: cmd 60/80:70:80:ab:af/01:00:02:00:00/40 tag 14 ncq 196608 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.687993] ata3.00: status: { DRDY }
      [ 1637.687998] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688009] ata3.00: cmd 60/00:78:00:ad:af/02:00:02:00:00/40 tag 15 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688015] ata3.00: status: { DRDY }
      [ 1637.688020] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688031] ata3.00: cmd 60/80:80:00:af:af/00:00:02:00:00/40 tag 16 ncq 65536 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688037] ata3.00: status: { DRDY }
      [ 1637.688042] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688053] ata3.00: cmd 60/00:88:80:af:af/01:00:02:00:00/40 tag 17 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688059] ata3.00: status: { DRDY }
      [ 1637.688064] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688075] ata3.00: cmd 60/80:90:80:b0:af/00:00:02:00:00/40 tag 18 ncq 65536 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688081] ata3.00: status: { DRDY }
      [ 1637.688085] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688096] ata3.00: cmd 60/00:98:00:b1:af/02:00:02:00:00/40 tag 19 ncq 262144 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688102] ata3.00: status: { DRDY }
      [ 1637.688107] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688118] ata3.00: cmd 60/00:a0:00:b3:af/01:00:02:00:00/40 tag 20 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688124] ata3.00: status: { DRDY }
      [ 1637.688129] ata3.00: failed command: READ FPDMA QUEUED
      [ 1637.688140] ata3.00: cmd 60/00:a8:00:b4:af/01:00:02:00:00/40 tag 21 ncq 131072 in
               res 40/00:ac:00:b4:af/00:00:02:00:00/40 Emask 0x50 (ATA bus error)
      [ 1637.688146] ata3.00: status: { DRDY }
      [ 1637.688154] ata3: hard resetting link
      [ 1638.179398] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1638.192977] ata3.00: configured for UDMA/133
      [ 1638.193029] ata3: EH complete
      [ 1640.259492] md: export_rdev(sdb1)
      [ 1640.326109] md: bind<sdb1>
      [ 1640.346712] RAID1 conf printout:
      [ 1640.346724]  --- wd:1 rd:2
      [ 1640.346731]  disk 0, wo:0, o:1, dev:sda1
      [ 1640.346736]  disk 1, wo:1, o:1, dev:sdb1
      [ 1640.346893] md: delaying recovery of md1 until md0 has finished (they share one or more physical units)
      [ 1657.987964] ata3.00: exception Emask 0x50 SAct 0x40000 SErr 0x280900 action 0x6 frozen
      [ 1657.987975] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1657.987984] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1657.987992] ata3.00: failed command: READ FPDMA QUEUED
      [ 1657.988006] ata3.00: cmd 60/00:90:00:30:2e/03:00:09:00:00/40 tag 18 ncq 393216 in
               res 40/00:94:00:30:2e/00:00:09:00:00/40 Emask 0x50 (ATA bus error)
      [ 1657.988013] ata3.00: status: { DRDY }
      [ 1657.988022] ata3: hard resetting link
      [ 1658.479548] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
      [ 1658.493107] ata3.00: configured for UDMA/133
      [ 1658.493147] ata3: EH complete
      [ 1670.547791] ata3: limiting SATA link speed to 1.5 Gbps
      [ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
      [ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
      [ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
      [ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547846] ata3.00: status: { DRDY }
      [ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547863] ata3.00: cmd 60/80:08:80:20:2e/00:00:0c:00:00/40 tag 1 ncq 65536 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547869] ata3.00: status: { DRDY }
      [ 1670.547875] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547886] ata3.00: cmd 60/00:10:00:21:2e/02:00:0c:00:00/40 tag 2 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547892] ata3.00: status: { DRDY }
      [ 1670.547896] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547907] ata3.00: cmd 60/00:18:00:23:2e/02:00:0c:00:00/40 tag 3 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547913] ata3.00: status: { DRDY }
      [ 1670.547918] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547929] ata3.00: cmd 60/00:20:00:25:2e/01:00:0c:00:00/40 tag 4 ncq 131072 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547935] ata3.00: status: { DRDY }
      [ 1670.547940] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547951] ata3.00: cmd 60/00:28:00:26:2e/02:00:0c:00:00/40 tag 5 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547957] ata3.00: status: { DRDY }
      [ 1670.547961] ata3.00: failed command: READ FPDMA QUEUED
      [ 1670.547972] ata3.00: cmd 60/00:30:00:28:2e/02:00:0c:00:00/40 tag 6 ncq 262144 in
               res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
      [ 1670.547978] ata3.00: status: { DRDY }
      [ 1670.547987] ata3: hard resetting link
      [ 1671.039264] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
      [ 1671.053386] ata3.00: configured for UDMA/133
      [ 1671.053444] ata3: EH complete
      [ 2422.512002] md: md0: recovery done.
      [ 2422.547344] md: recovery of RAID array md1
      [ 2422.547355] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
      [ 2422.547360] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
      [ 2422.547378] md: using 128k window, over a total of 4877312k.
      [ 2422.668465] RAID1 conf printout:
      [ 2422.668474]  --- wd:2 rd:2
      [ 2422.668480]  disk 0, wo:0, o:1, dev:sda3
      [ 2422.668486]  disk 1, wo:0, o:1, dev:sdb3
      [ 2469.990451] md: md1: recovery done.
      [ 2470.049986] RAID1 conf printout:
      [ 2470.049997]  --- wd:2 rd:2
      [ 2470.050003]  disk 0, wo:0, o:1, dev:sda1
      [ 2470.050009]  disk 1, wo:0, o:1, dev:sdb1
      [ 3304.445149] PM: Hibernation mode set to 'platform'
      [ 3304.782375] PM: Syncing filesystems ... done.
      [ 3307.028591] Freezing user space processes ... (elapsed 0.001 seconds) done.
      (...)

1
SATA 또는 전원 케이블이 불량하거나 전원 공급 장치가 불량 일 수 있습니다.
토마스

1
나는 또한 얼어 붙은 리셋 컨트롤러가 나쁜 컨트롤러로 보았습니다.
Stephen Harris

1
비슷하지만 동일하지 않은 dmesg 출력을 포함하는이 질문에 대한 답변을 추가했습니다 (예 : SD 1 : 0 : 0 : 0 : 오프라인 장치에 대한 I / O 거부 및 EXT4-fs 경고). . unix.stackexchange.com/help/deleted-answers에 명시된 이유와 일치하지 않더라도 답변이 삭제되었습니다 . / home에 마운트 된 SSD에 문제가있었습니다. 전원 및 SATA 케이블을 분리했다가 다시 연결하려고했지만 오류가 지속되었습니다. 운 좋게도 여분의 SATA 케이블이있었습니다. SATA 케이블을 교체 한 후에도 오류가 없었으며 문제가 다시 발생하지 않았습니다.
htaccess

답변:


22

먼저 SMART는 드라이브가 정상이라고해서 반드시 드라이브 정상 임을 의미하지는 않습니다 . SMART 보고서는 절대적인 사실 이 아니라 도움이 됩니다.

당신이 관심있는 모든 것이 이유가 아니라해야 할 일이라면, 마지막 몇 단락으로 자유롭게 스크롤하십시오. 그러나 임시 텍스트는 내가 제안하는 것이 올바른 행동 과정이라고 생각하는 이유와 게시 한 내용에서 파생시키는 방법을 알려줍니다.

그 말로, 그 오류 중 하나가 우리에게 무엇을 말하고 있는지 봅시다.

[ 1670.547805] ata3.00: exception Emask 0x50 SAct 0x7f SErr 0x280900 action 0x6 frozen
[ 1670.547812] ata3.00: irq_stat 0x08000000, interface fatal error
[ 1670.547820] ata3: SError: { UnrecovData HostInt 10B8B BadCRC }
[ 1670.547826] ata3.00: failed command: READ FPDMA QUEUED
[ 1670.547839] ata3.00: cmd 60/80:00:00:1f:2e/01:00:0c:00:00/40 tag 0 ncq 196608 in
           res 40/00:2c:00:26:2e/00:00:0c:00:00/40 Emask 0x50 (ATA bus error)
[ 1670.547846] ata3.00: status: { DRDY }
[ 1670.547852] ata3.00: failed command: READ FPDMA QUEUED

(나는 함께 갈 수있는 부품을 얻었기를 바랍니다. 그러나 당신은 그 번들을 얻었으므로 어느 쪽이든 괜찮을 것입니다.)

리눅스 ATA 위키는 이러한 오류를 읽는 방법을 설명하는 페이지가 있습니다 . 특별히,

  • status의 값 DRDY수단 "장치 준비. 일반적으로 1, 모두 OK입니다." 상태 값을 보는 것은 DRDY완전히 정상이며 예상됩니다.
  • SError 여러 개의 구성 요소 값이 있으며이 값 중 특정 스 니펫에 표시됩니다.
    • UnrecovData "데이터 무결성 오류가 발생하여 인터페이스가 복구되지 않았습니다."
    • HostInt "호스트 버스 어댑터 내부 오류"
    • 10B8B "10b ~ 8b 디코딩 오류가 발생했습니다"
    • BadCRC "링크 계층 CRC 오류가 발생했습니다"

신호 동기화 및 오류 감지를 지원하기 위해 8 비트를 10 비트로 인코딩하는 10b8b 코딩은 드라이브 자체가 아니라 물리적 케이블에 사용됩니다. 이 드라이브는 대부분 사용 FEC 또는 ECC 코딩의 다른 형태를하고, 오류가 일반적 일 가능성과 함께, I / O 오류가 어떤 형태로도 표시 할 errorUNC( "수정할 수없는 오류 - 자주 인해 디스크에 불량 섹터에") res줄 끝의 괄호 안에 "미디어 오류"( "소프트웨어가 미디어 오류를 감지했습니다")가있을 수 있습니다. 후자는 당신이보고있는 것이 아니기 때문에 완전히 배제 할 수는 없지만 그럴 것 같지 않습니다.

"링크 계층"은 드라이브 자체 컨트롤러와 디스크 드라이브 인터페이스 칩 ( 컴퓨터 마더 보드 의 사우스 브리지의 일부 이지만 오프 보드 HBA에 위치 할 수 있음) 사이의 물리적 케이블 및 회로 보드 추적 입니다.

HBA라고도하는 호스트 버스 어댑터는 스토리지 장비에 연결되는 회로입니다. 구어 적으로 "디스크 컨트롤러"라고도하는이 용어는 현대 시스템에서는 약간 잘못된 용어입니다. HBA에서 가장 눈에 띄는 부분은 일반적으로 연결 포트이며, 대부분은 오늘날 SATA 또는 일부 SAS 폼 팩터입니다.

UnrecovDataHostInt플래그는 기본적으로 "뭔가 그냥 끔찍하게 잘못 가고, 거기에 복구 할 방법이 없었다 또는 복구의 시도는하지 않았다"고 말해. RecovData"데이터 무결성 오류가 발생했지만 인터페이스가 복구 됨"을 나타내는 반대 일 수 있습니다 . (제외 적 으로, "호스트"는 전체 시스템이 아닌 HBA를 나타 내기 때문에 아마 HBAInt대신에 사용했을 것 HostInt입니다.)

물리적 링크 계층을 가리키는 10B8B및 의 조합으로 BadCRC인해 케이블 연결 문제가 의심됩니다.

이러한 의심은 상태보고를 제외하고 드라이브 내부에 완전히 내장 된 SMART 자체 테스트에서 제조업체가 결과보고를 보증 할만큼 심각하다고 느끼는 오류를 찾지 못한다는 사실에 의해 뒷받침됩니다. 드라이브가 데이터를 저장하거나 읽는 데 문제가있는 경우 특히 긴 SMART 자체 테스트에서이를보고해야합니다.

TL; DR :

가장 먼저해야 할 일은 SATA 케이블의 양쪽 끝뽑았다가 다시 꽂는 것입니다. 약간 느슨해져 간헐적으로 전기 접점이 끊어 질 수 있습니다. 문제가 해결되는지 확인하십시오. 영향을받는 디스크뿐만 아니라 컴퓨터의 모든 SATA 케이블에이 작업을 수행하는 것이 좋습니다. 오프 보드 HBA를 사용하는 경우 케이블을 이미 엉망으로 만드는 동안 쉽게 시도 할 수 있기 때문에 해당 카드를 제거했다가 다시 장착합니다.

실패 하면 SATA 케이블을 버리고 교체하십시오. 고품질 케이블을 사용하는 것이 좋습니다. 고품질 케이블은 약간 비싸지 만, 두통을 피하는 데 도움이된다면 일반적으로 작은 추가 비용이 가치가 있음을 알았습니다. 스토리지 스푸핑 오류를 보는 사람은 아무도 없습니다!


2
SATA 케이블을 뽑았다가 다시 꽂아서 문제를 해결했습니다. 감사!
user983447

@ user983447 도와 줘서 다행입니다!
CVn

0

제 경우에는 두 개의 다른 디스크 컨트롤러에 두 개의 디스크를 꽂았습니다. 첫 번째는 PCI-Express이고 두 번째는 일반 PCI입니다. 동일한 컨트롤러에 두 RAID 디스크를 모두 꽂았을 때 BadCRC 오류를 제거했습니다.


1
컨트롤러가 죽으면 두 디스크를 모두 사용합니까?
roaima

예. 그러나 디스크가 컨트롤러보다 죽을 가능성이 훨씬 큽니다. 또한 PCI 컨트롤러를 사용하지 말고 고속 PCI-Express 컨트롤러를 사용하는 것이 좋습니다.
PHZ.fi-Pharazon
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.