btrfs와 ext4 오류가 발생했습니다. 내 RAM을 테스트하기로 결정한 후 다음과 같은 반복 오류가 발생했습니다 memtester
. 나는 약간의 실행 후 항상 비슷한 오류가 발생합니다 memtester
. 보통 1 시간이 걸리지 만 한 번에 4-5 시간이 걸렸습니다.
내 컴퓨터의 RAM이 납땜되었습니다. 빈 슬롯이 추가되었습니다. 온보드 RAM을 비활성화하기위한 BIOS 설정이 없습니다.
나는 달렸다.
- 8 회 패스 (~ 8 시간) 동안 Memtest86 +
- 18 패스 (~ 9 시간) 동안 MemTest86
memtester
그리고stressapptest
페도라 27 기본에, USB 스틱에 설치 (10 ~ 시간)memtester
그리고stressapptest
우분투 17.10 라이브 기본에 (~ 2 시간)memtester
그리고stressapptest
USB 스틱에 우분투 17.10에 (~ 8시간)# debsums --changed
유일하게 변경된 파일은 테마의 이미지였습니다.
그들은 오류를 인쇄하지 않았습니다.
기본 커널과 함께 우분투 17.10 (17.04에서 업그레이드 됨)을 사용하고 있습니다. 커널이 오염되지 않았습니다. Intel Haswell i3가 장착 된 ASUS 노트북입니다.
- 또한 Linux 4.14.13 및 4.15.0-rc3, rc4, 메인 라인에서 테스트되었습니다.
- 또한 퍼지 된 인텔-마이크로 코드 패키지로 테스트되었습니다.
Nouveau가 비활성화되어 있거나 삭제되어 nvidia 바이너리 드라이버가로드되지 않았습니다.
다음 모듈을 블랙리스트에 올렸습니다 mtd
intel_spi_platform
intel_spi
. 기본 Fedora 27 설치시로드되지 않고 일부 Lenova 랩톱 을 사용하지 않는 것 같습니다 . 오류가 중지되지 않았습니다.
uname -a
의 출력
Linux hostname 4.13.0-19-generic #22-Ubuntu SMP Mon Dec 4 11:58:07 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
# lsmod
의 출력
https://paste.ubuntu.com/26222245/
Fedora 27의 # lsmod
출력
https://paste.ubuntu.com/26226473/
현재 상황
나는 잘 알려진 것으로 알려진 랩탑 (백업 랩탑)에 HDD를 넣고 테스트를 수행했습니다. 오류가 발생했습니다. 이제 이것이 소프트웨어 문제라고 확신합니다. 나는 신선한 우분투 나 페도라로 여러 시간 동안 랩톱에서 오류를 유발할 수 없었습니다.
어떻게해야합니까?
오류 샘플 :
Loop 6:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : testing 262
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94000.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94008.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94010.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94018.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94020.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94028.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94030.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94038.
Walking Ones : ok
Walking Zeroes : ok
8-bit Writes : ok
16-bit Writes : ok
두 RAM 슬롯의 비슷한 오류가 가득 찼습니다.
Loop 1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : testing 4
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80000.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80008.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80010.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80018.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80020.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80028.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80030.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80038.
Bit Flip : setting 141
오류 stressapptest
:
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e000(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e008(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e010(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e018(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e020(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e028(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e030(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e038(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
내 노트북의 하드웨어와 결합 된 Ubuntu의 구성이 이러한 오류에 대한 책임이 있다고 생각합니다. 거의 항상 8 팩.
중요하지 않고 느슨하게 관련된 정보
btrfs 오류 정보 17.04를 사용하고있었습니다. 나는 btrfs의 irc에서 물었다. 하드웨어 오류이거나 메모리 관리 오류 일 수 있다고 들었습니다. 내가 경험했던 것처럼 btrfs의 메타 데이터 페이지의 일부가 0으로 채워졌습니다. 나는 단지 몇 번의 패스로 memtester를 실행하고 ext4로 전환하여 nvidia 바이너리 드라이버를 비난했습니다.
내가 사용하는 명령과 매개 변수 :
# stressapptest -M 10000 -s 1800
10000은 테스트 할 수있는 사용 가능한 메모리입니다. 를 통해 나는 그것을 얻을 free -m
-s`는 초입니다.
# memtester 4096
랩톱의 CPU에는 2 개의 코어가 있으므로 보통 두 개의 인스턴스를 시작합니다. 4096은 현재 사용 가능한 메모리의 절반입니다.free -m
memtest86+
Ubuntu 설치 LiveCD에서 시도하십시오 .