이 드라이브 오류입니까 아니면 다른 것입니까?


12

나에게 문제를 일으키는 오래된 드라이브가 있습니다. 약 8-10GB의 전송 후에 데이터를 복사 할 수 없습니다. 자발적으로 '읽기 전용'으로 변경됩니다. ext4 형식이 올바르게 지정되어 있으며 소유자입니다. 온라인으로 검색하면 고장난 드라이브의 증상 인 것 같습니다.

SMART 테스트에서 다르게 표시되었으므로이를 어떻게 확인합니까?

디스크 유틸리티를 확인하고 확장 된 SMART 테스트를 실행하는 것과 같은 명확한 작업을 수행했습니다. 디스크 유틸리티의 모든 결과가 완벽하게 돌아옵니다. 읽기 오류율과 재 할당 된 섹터가 0으로 표시됩니다.

나는이 디스크가 나쁘고 SMART가 디스크를 감지하지 못하지만 그 이유를 이해하지 못한다고 생각합니다. 문제가 무엇인지 확인하고 싶습니다.

컴퓨터의 다른 디스크에 문제가 없습니다.

fstab :

proc / proc proc nodev, noexec, nosuid 0 UUID = 62e11126-3f06-43f0-bd5a-29b411bb8160 / ext4
errors = remount-ro 0 1
UUID = 5e2d6348-be6e-4d5d-8f7f-1a5c1cab7db2 / home ext4
기본값 0 2 97e594a3-c783-4c73-97c0-682afcdc88b6 none swap sw 0
/ dev / disk / by-label / Media / media / Media ntfs-3g 기본값, user, locale = en_GB.utf80

출력 dmesg | less: (위의 '버퍼 I / O 오류'라인이 수백 개 더 있습니다)

[22734.511487] Buffer I/O error on device sda1, logical block 302203
[22734.511489] Buffer I/O error on device sda1, logical block 302204
[22734.511490] Buffer I/O error on device sda1, logical block 302205
[22734.511492] Buffer I/O error on device sda1, logical block 302206
[22734.511494] Buffer I/O error on device sda1, logical block 302207
[22734.511496] EXT4-fs warning (device sda1): ext4_end_bio:251: I/O error writing to inode 9437465 (offset 4194304 size 524288 starting block 302215)
[22734.511500] ata1: EH complete
[22734.511616] EXT4-fs error (device sda1): ext4_journal_start_sb:327: Detected aborted journal
[22734.511619] EXT4-fs (sda1): Remounting filesystem read-only
[22734.519343] EXT4-fs error (device sda1) in ext4_da_writepages:2298: IO failure
[22734.538566] EXT4-fs (sda1): ext4_da_writepages: jbd2_start: 601 pages, ino 9437474; err -30
[22734.560225] ata1.00: exception Emask 0x10 SAct 0x1 SErr 0x400100 action 0x6 frozen
[22734.560253] ata1.00: irq_stat 0x08000000, interface fatal error
[22734.560256] ata1: SError: { UnrecovData Handshk }
[22734.560258] ata1.00: failed command: WRITE FPDMA QUEUED
[22734.560262] ata1.00: cmd 61/00:00:3f:68:25/04:00:00:00:00/40 tag 0 ncq 524288 out
[22734.560263]          res 40/00:04:3f:68:25/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[22734.560264] ata1.00: status: { DRDY }
[22734.560268] ata1: hard resetting link
[22735.047845] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[22735.052069] ata1.00: configured for UDMA/33
[22735.067810] ata1: EH complete
[22735.136249] ata1.00: exception Emask 0x10 SAct 0x3f SErr 0x400100 action 0x6 frozen  

fsck 결과:

tom@1204-Desktop:~$ sudo fsck /dev/sda1
[sudo] password for tom: 
fsck from util-linux 2.20.1
e2fsck 1.42 (29-Nov-2011)
New_Volume: recovering journal
New_Volume contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
Free blocks count wrong (236669077, counted=236701938).
Fix<y>? yes

Free inodes count wrong (61048336, counted=61048349).
Fix<y>? yes

마지막으로 읽기 / 쓰기 화면 캡처는 새로운 기능입니다. 테스트 기간 동안 일관되게 유지되었습니다.

읽기 쓰기 screengrab

편집-오늘 아침에 전원을 켰을 때 드라이브가 / dev / sda에서 / dev / sdc로 변경되었습니다. 나는 전에 일어난 적이 없다고 확신하고 / dev / sda라고 확신합니다. SATA 케이블을 양호한 것으로 교체했으며 약 10GB 전송에서 동일한 오류가 발생했습니다. SATA 포트는 아직 변경하지 않았으므로 다음에 시도하겠습니다. (편집 # 2, SATA 포트이므로 문제가 해결되었습니다. 너무 현지화 된 것으로 표시합니다.)

출력 sudo smartctl -a /dev/sda

=== START OF INFORMATION SECTION === Model Family:     Western Digital Caviar Black Device Model:     WDC WD1002FAEX-00Y9A0 Serial Number:    WD-WCAW30776630 LU WWN Device Id: 5 0014ee 25acf2868 Firmware Version:
05.01D05 User Capacity:    1,000,204,886,016 bytes [1.00 TB] Sector Size:      512 bytes logical/physical Device is:        In smartctl database [for details use: -P show] ATA Version is:   8 ATA Standard is:  Exact ATA specification draft version not indicated Local Time is:    Fri May 25 07:16:18 2012 BST SMART support is: Available - device has SMART capability. SMART support is: Enabled

=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED

General SMART Values: Offline data collection status:  (0x82)   Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled. Self-test execution status:      (   0)  The previous self-test routine completed
                    without error or no self-test has ever 
                    been run. Total time to complete Offline  data collection:      (16500) seconds. Offline data collection capabilities:           (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported. SMART capabilities:            (0x0003)  Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer. Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported. Short self-test routine  recommended polling time:    (   2) minutes. Extended self-test routine recommended polling time:    ( 170) minutes. Conveyance self-test routine recommended polling time:      (   5) minutes. SCT capabilities:
           (0x3035) SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE   1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always  
-       0   3 Spin_Up_Time            0x0027   176   173   021    Pre-fail  Always       -       4183   4 Start_Stop_Count        0x0032 100   100   000    Old_age   Always       -       774   5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always  
-       0   7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0   9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       5518  10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always  
-       0  11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0  12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       772 192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always  
-       39 193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       736 194 Temperature_Celsius     0x0022  118   111   000    Old_age   Always       -       29 196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always  
-       0 197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0 198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0 199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always  
-       0 200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1 No Errors Logged

SMART Self-test log structure revision number 1 Num  Test_Description  Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5514         -

SMART Selective self-test log data structure revision number 1  SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing Selective self-test flags (0x0):   After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.

sudo smartctl -a /dev/sda
ish

5
SATA 케이블을 교체하십시오. 나쁠 수 있습니다.
psusi

@psusi 불행히도 그것은 도움이되지 못했습니다.
Tom Brossman

답변:


12

SMART 테스트에서 다르게 표시되었으므로이를 어떻게 확인합니까?

SMART 테스트는 "절연"됩니다. 즉, 일단 smartctl드라이브가 테스트를 수행하도록 명령하면 드라이브는 모든 것을 내부적으로 처리 한 다음 다시보고합니다. 따라서 드라이브 / 컨트롤러와 마더 보드간에 문제가 나타나지 않을 수 있습니다.

  • 명백한 추론은 잘못된 케이블이지만 디스크 유틸리티 그래프에서는 지원되지 않습니다. 읽기도 영향을 받아야합니다. 그래도 케이블 / SATA 포트를 교체하여 차이가 있는지 확인하십시오.
  • smartctl -t long;로 긴 자체 테스트를 실행하십시오 . 캡처 모드에서 가장 빠르며 -C(모든 파티션을 마운트 해제하십시오!) 완료되면 상태 / 오류를 확인하십시오 -l(오류가 감지되는 즉시 테스트가 중단됨)
  • 문제가 해결되면 소프트웨어 쪽에서이 문제를 일으킬 수있는 것을 기억하십니까? 커널 업그레이드 / 다운 그레이드 등?
  • 마지막으로, 다른 모든 디스크에 문제가 없으면 드라이브의 쓰기 캐시 컨트롤러에 이상이있을 수 있습니다. 가능한 빨리 데이터를 백업하고 RMA하십시오.

    (의견에 질문을 게시하면 답변을 업데이트하겠습니다. 행운을 빕니다!)


SATA 포트를 교체하고 200GB 이상을 문제없이 복사했습니다. 고정 된 것처럼 보입니다. 자세한 답변 주셔서 감사합니다.
Tom Brossman

4
@TomBrossman, 2011 년 2 월경부터는 샌드 브리지 칩셋 시스템이되지 않습니까? 그들은 시간이 지남에 따라 sata 포트가 고장 나고 큰 리콜을 일으킨 결함이있었습니다.
psusi

@psusi 맞습니다. 문제를 해결하기 위해 수행 할 작업을 요청하는 이메일을 ASUS 지원 센터에 보냈습니다. 나는 리콜에 대해서도 몰랐다. 알아 둘만 한!
Tom Brossman

3
@TomBrossman, 나는 마침내 6 개월 전에 광산을 대체하게되었습니다. 그들은 리콜이 끝났다는 슬픔을 주었다. 그러나 마침내 나에게 교체품을 보냈다. 바이오스가 사우스 브리지의 스테핑을 나열하고 B2 인 경우 리콜 된 것이므로 교체해야합니다.
psusi

3
@TomBrossman : mobo의 결함이있는 Intel SATA 컨트롤러입니다. 확인하려면 다음을 참조하십시오 : event.asus.com/2011/mb/identify_b3_motherboards 아주 좋은 캐치 @psusi! 결함이있는 B2를 사용하는 경우 한 가지 해결책은 타사 컨트롤러 인 SATA3 포트 (일반적으로 Marvell)를 사용하는 것입니다. 또한이 snafu에 대해 Asus-intel 유료 mfrs 및 소매점에 문의하십시오.
ish
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.