이 SATA 오류는 위험합니까?


36

이 오류가 무작위로 발생하고 정상인지 여부를 알 수 없습니다.

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

sda , sdbsdc 도 붙여 넣 smartctl -a습니다 .

도움을 주셔서 감사합니다.

답변:


16

나는 본질적으로 Geppettvs D' Constanzo의 답변에 동의하지만 , 당신이 시도 할 수도있는 첫 번째 것들 중 일부는 다음과 같습니다.

  1. SATA 케이블이 마더 보드 및 하드 드라이브의 소켓에 단단히 연결되어 연결되어 있는지 확인하십시오.

  2. SATA 케이블을 교체하십시오. SATA 케이블은 상대적으로 저렴하며 때때로 " 나쁜 " 케이블을 얻습니다 . 종종 케이블을 교체하는 것이 이와 같은 문제를 진단하고 해결하는 가장 쉬운 방법입니다.

( 케이블이 동시에 불량한 것은 다소 예상치 못한 일이지만, 내 의견으로는 그렇게할만한 가치가 있다고 생각하기 쉽습니다.)

방금 드라이브에 대한 SMART 데이터가 포함 된 Pastbins를 보았습니다. 드라이브 sdb및에 대한 예기치 않은 많은 수의 CRC 오류를 확인하십시오 sdc. 해당 드라이브의 케이블과 연결을 확인하여 시작하는 것이 좋습니다.

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

승인. 그래서 latpop이 아닙니다 . ;-)
물론, 위의 어느 것보다 랩톱에서 이런 일이 발생하면 어떤 조언을 제공해야할지 잘 모르겠습니다. 하드 드라이브를 제거했다가 다시 설치 하시겠습니까? 아마도 연결을 개선하기 위해 소켓에 다시 장착해야합니까?


sbdsdc같은 외부 전자 SATA 케이블 (써멀 듀오 독 HDD)에 접속된다. e-sata 케이블을 교체하겠습니다.

케이블 결함 또는 품질 저하로 인한 것일 수 있습니다. 또한 드라이브를 사용하는 동안 케이블이 어떻게 움직이거나 부딪 히거나 충격을받을 수도 있습니다.


1
sbd그리고 sdc모두 동일한 외부 전자 SATA 케이블 (써멀 듀오 독 HDD)에 접속된다. e-sata 케이블을 교체하겠습니다.
Marcos Junior

9

품질이 좋지 않거나 손상된 SATA 전원 / 데이터 케이블이있는 것 같습니다. 나쁜 CRC를 유발할 수 있습니다. 그들은 전혀 해롭지 않으며 그들과 함께 살 수는 있지만 곧 많은 데이터를 잃을 것입니다.

하드 디스크 드라이브에 대한 SMART 보고서가 제대로 보이지 않으므로 동일한 케이스 / 전원에서 5 개의 하드 디스크 드라이브를 설정할 때의 경험을 바탕으로 전원 공급 장치 문제가 있습니다. GPU, 광학 및 하드 디스크 드라이브를 포함한 모든 경우에 2 개의 드라이브에 외부 전원 (475W)을 사용하고 케이스의 600W를 사용했습니다.

어쨌든 다른 작업을 수행하기 전에 전체 백업을 실행하는 것이 좋습니다. 가능하면 하드 디스크 드라이브를 복제 한 후 케이블과 전원 전압을 확인해야합니다.


호기심으로, 그 GPU는 크고 혼잡 한 전력 배고픈 GPU입니까?
불합리한 John

1
nVidia Quadro 4000은 실제로 배고프지 않습니다.
Geppettvs D' Constanzo

1
흥미 롭군 400w Antec (Neo-Eco) PSU, 5 개의 하드 드라이브, 2 개의 광학 드라이브 및 NVIDIA GeForce 9500 GT가 있으며 전원 공급 장치 관련 문제가 없다고 생각합니다. 나는이 할 드라이브 CRC 오류 ,하지만 그들은 내가 한참을 만든 바보 같은 사용자 오류를 생각합니다. (케이블 범프 등) 커널 메시지 에 경고 로그가 표시되지 않습니다 . 그래도 안전을 위해주의 깊게 지켜봐야 할 것 같습니다.
불합리한 John

1
1xIDE DVD-RW, 1xSATA DVD-RW 및 1xSATA Blu-Ray ROM 광 드라이브이면. SATA 4 개 및 IDE HDD 1 개, GPU의 전력 소비는 142 와트입니다. 나는 그것이 전원 문제에 관한 것이라고 확신 할 수는 없지만 새로운 전원을 추가하면 문제가 사라졌습니다. BTW, 내 드라이브는 건강 해 보입니다. 하지만 저를 보게 해주셔서 감사합니다. 귀하의 의견은이 측면에서 정말 감사합니다. 감사합니다!
Geppettvs D' Constanzo

1
어, GPU의 142 와트는 ...입니다. 내 전체 시스템은 (보통) 그보다 적게 사용합니다. 이것을 입력하면 데스크탑 박스가 ~ 117 와트를 당기고 있습니다. ( Watt-A-Watt 에 따르면 잊어 버린 것을 여전히 꽂았습니다. ;-)
비이성적 John

4

일부 커널 버전과 일부 SATA 컨트롤러간에 문제가있는 것 같습니다.

최근에 Scientific Linux를 실행하는 웹 서버에서 매우 유사한 문제가 발생하기 시작했습니다 (동일한 지 확실하지 않음).

이러한 문제에 대해 내가 찾은 가장 정확하고 완전한 정보는이 런치 패드 버그 입니다.

한마디로 : NCQ 비활성화 는이 문제가있는 사용자에게 가장 좋은 해결 방법 인 것 같습니다.


3
NCQ 비활성화는 버그가있는 하드웨어에 대한 일반적인 해결 방법입니다. 커널 버그가없는 것 같습니다.
psusi

작동하는 거룩한 $ #! +! 모든 오류 메시지가 사라지고 시스템이 중단되었습니다! 충돌없이 구형 커널 버전 (최소 2.6 시리즈까지 사용 가능)을 사용할 수 있기 때문에 커널 버그가 아니라는 것에 전적으로 동의하지 않습니다. 나는 이것을 빨리 찾지 못했다고 믿을 수 없다!
reukiodo

1

이것은 거의 항상 나쁜 드라이브입니다. 우리가 사용하는 수천 개의 드라이브가 있으며 이러한 오류로 인해 드라이브가 실패하지는 않지만 파일 시스템이 손상되었습니다. 드라이브의 컨트롤러 보드 문제와 관련이 있다고 생각합니다.

나는이 문제를 해결하기 위해 모든 것을 시도했지만, 수정은 드라이브를 교체하고 동일한 케이블과 컨트롤러에서 작동하는 것입니다.

행운을 빕니다


생계를 위해 이러한 문제를 30 년 넘게 해결 한 후에는 제 경험에 의하면 거의 항상 엉뚱한 케이블임을 확신 할 수 있습니다. 그리고 그들이 싸기 때문에 당신은 그것을 먼저 시도하십시오.
eek

0

이 스레드가 오래되었다는 것을 알고 있지만 최근에 6 개의 sata 슬롯이있는 새로 구입 한 시스템에서 동일한 문제가 발생했습니다. 나는 cdrom과 hardrive를 서로 가까운 두 개의 sata 슬롯에 설치 한 다음 재부팅 할 때까지 오류없이 우분투 설치를 계속했습니다 .ata8 : 하드 재설정 링크 오류가 나타났습니다. 이 시점까지 기계는 정지되지 않습니다. 몇 번 재부팅을 시도했지만 작동하지 않았습니다. 그런 다음 사용 가능한 4 개의 슬롯 중 하나에서 hardrive를 교체하려고했지만 번거 로움없이 제대로 작동했습니다.


하드 드라이브가 연결된 SATA 포트를 변경 했습니까? 아니면 전체 하드 드라이브를 다른 하드 드라이브로 교체 했습니까? 나는 그것이 전자라고 생각하지만, 단지 다시 확인하기
Xen2050

전자입니다.
ultrajohn



0

나는 같은 문제가 있었다. 나는 모든 것을 시도했지만 내 asus p5k의 j-micron 포트에서만 오류가 발생하지 않았습니다.

그러나 드라이브를 다른 전원 공급 장치에 넣으면 작동하고 오류가 사라졌습니다. 그런 다음 드라이브를 원래 전원 공급 장치에 다시 장착했지만 새 전원 커넥터가 작동했습니다.


0

이 스레드가 오래되었다는 것을 알고 있지만 동일한 문제가 발생하여 Google에서 여기에 왔습니다.

  • 점점 ata3.01: failed command: READ FPDMA QUEUED쿠분투 16.04 라이브 CD를 부팅에.
  • WINDOWS 7은 이상하게 동작하고 잠시 동안 작동하지만 YouTube를 시청 한 후에 정지합니다.

SATA 케이블을 변경해도 아무런 변화가 없습니다.
PSU를 교체하고 문제가 해결되었습니다.


0

이 오류는 하드 드라이브를 손상 시키지는 않지만 파일 시스템을 손상시킬 가능성이 높습니다. 어떤 드라이브가 오류를 발생시키는 지 확인하여 시작하십시오. 일반적으로 다음과 같은 여러 가지 접근 방식으로 쉽게 결정됩니다.

1) 명령을 내리고 dmesg | grep ata3하드 드라이브 제조업체 및 모델을 찾습니다. (ata3은 상황에 따라 오류를 발생시키는 포트이므로 적절하게 조정하십시오) 다음과 유사한 출력을 제공합니다.

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

한눈에 ata3에 연결된 드라이브가 SAMSUNG HD103SJ임을 나타냅니다.

2) 아래 명령을 발행하십시오.

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

포트와 장치 이름이 아래와 같이 같은 줄에 강조 표시됩니다.

산출

ata3에 연결된 장치에 sdb라는 장치 이름이 할당되어 있음을 쉽게 알 수 있습니다.

3) lsscsi를 설치 sudo apt install lsscsi하고 명령을 실행하십시오.lsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

위의 각 줄의 첫 번째 항목은 scsi_host, channel, target_number 및 LUN입니다. 대괄호로 묶고 각 요소는 콜론으로 구분됩니다. 여러 SCSI 장치가있는 경우 해당 항목은 오름차순으로 정렬됩니다.

각 출력 라인의 첫 번째 숫자에 1을 추가하면 ATA 포트가 제공됩니다. lsscsi 여기여기 에서 자세한 내용을 찾을 수 있습니다 .

귀하의 경우 3.00 및 3.01 모두에서 오류가 발생하므로 동일한 ATA 포트에 하나 이상의 드라이브가 연결되어 있습니다. ata3.00 및 ata3.01에 대한 연결을주의 깊게 확인하려고합니다. 이것은 동일한 케이블에 연결된 다중 베이 드라이브 인클로저 일 수 있습니다. 두 드라이브 모두 오류가 발생하므로 위에서 언급 한 멀티 드라이브 베이로 케이블을 교체하면 두 드라이브의 문제가 해결됩니다. 이러한 장치에는 일반적으로 범인이 될 수 있고 교체해야 할 외부 전원이 있지만 케이블 (가장 약한 링크)이 문제의 근본 원인 일 가능성이 큽니다.

출처 :

경험

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.