RAM 테스트가 일관되지 않음-가장 범인은 무엇입니까? (즉 교체에 돈을 어떻게 써야합니까)


20
  • 마더 보드 : GA-B85M-DS3H-A
  • CPU : 코어 i5 4430
  • RAM : PNY XLR8 DDR3 32GB (4x8GB) 1600MHz (MD32768K4D3-1600-X9)
  • PSU : EVGA 500 W1 80+

문제

모든 32GB RAM이 설치되어 있으면 시스템에서 MemTest86 + 6.2가 일관되게 실패합니다. 실패는 항상 첫 번째 통과 중에 발생하며 오류는 수백만 개의 오류로 빠르게 증가합니다. Windows를 실행하려고하면 RAM 오류로 예상되는대로 임의 재부팅 및 중지 오류가 발생합니다.

내가 시도한 것

  • 소켓 DIMM1에서 단일 8GB PNY 모듈을 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓 DIMM2에서 단일 8GB PNY 모듈을 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓 DIMM3에서 단일 8GB PNY 모듈을 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓 DIMM4에서 단일 8GB PNY 모듈을 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓 DIMM1에서 4 개의 8GB PNY DIMM을 개별적으로 개별적으로 테스트하십시오. 모든 모듈은 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓 DIMM1 및 DIMM2에서 2 개의 8GB PNY 모듈을 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓 DIMM3 및 DIMM4에서 2 개의 8GB PNY 모듈을 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 모든 소켓에서 4GB의 2GB로 잘 알려진 DIMM으로 마더 보드를 테스트하십시오. 4 번의 MemTest 패스를 성공적으로 완료합니다.
  • 소켓에서 PNY DIMM 주문을 교체하십시오. 변경 사항 없음-MemTest 오류가 계속 발생합니다.
  • 메인 보드 RAM 전압을 1.5v에서 1.65V로 올리십시오. 변경 사항 없음-MemTest 오류가 계속 발생합니다.
  • 설정 유틸리티에서 RAM 수동 설정의 다양한 조합을 사용하여 재생합니다. XMP 프로파일 활성화 / 비활성화, "안정성 향상"사전 설정 등 변경 사항이 없습니다. MemTest 오류는 여전히 발생합니다.

나는 나쁜 RAM과 나쁜 RAM 소켓을 안전하게 배제 할 수 있다고 생각합니다. MemTest 테스트가 실패 하는 유일한 시간은 4 개의 8GB 모듈이 모두 동시에 설치된 경우입니다.

PSU에서 나오는 전압을 측정했으며 4 개의 스틱을 모두 설치해도 모든 것이 안정적으로 나타납니다.

이 글을 쓰면서 BIOS에서 RAM 속도를 1066MHz로 수동으로 줄이는 최후의 수단을 시도했습니다. 지금까지 MemTest는 한 번의 통과를 완료했으며 오류없이 두 번째 단계에 있습니다. (위의 모든 테스트는 기본 1600MHz RAM 속도로 수행되었습니다.) 이렇게하면 약간 느린 RAM 속도로 시스템을 사용할 수 있지만 영구적 인 수정은 아닙니다.

MemTest 오류가 발생할 때마다 항상 64 비트 주소 버스에서 동일한 위치에 발생합니다.

Bit Error Mask: 00000000FF000000

또한 4GB 이하에서는 오류가 발생하지 않습니다. 즉, 모든 오류는 주소 공간에서 4GB와 32GB 사이에서 발생합니다.

나는 오류가 매우 일관되고 하나의 특정 구성에서만 발생하고 RAM 속도를 늦춤으로써 완화 된 것처럼 보이기 때문에 CPU와 RAM 및 마더 보드와의 이상한 상호 작용이나 타이밍 문제로 이것을 추론하고 있습니다. 4GB 장벽 이상에서만 발생합니다. 내 질문은 : 내 CPU 또는 내 마더 보드가 범인 일 가능성이 더 큽니까?

이 시스템을 Core i7-4790K로 업그레이드하려고했기 때문에 CPU가 범인 일 가능성이있는 경우 (메모리 컨트롤러가 최신 모델의 CPU에 있음을 알고 있음) 업그레이드 할 계획이므로 제대로 작동합니다. 어쨌든, 나는 마더 보드 자체가 문제의 일부가 될 가능성이 있는지 궁금합니다. 즉, 똑같은 문제를 경험하고 마더 보드를 교체해야한다는 것을 알기 위해 i7 CPU에만 돈을 쓰고 싶지 않습니다 ...

조언?


편집 : 느린 RAM 속도는 여전히 오류를 생성했지만 테스트가 세 번째 패스에 도달하면 한 번만. CPU 자체의 상호 작용을 테스트하기 위해 하나의 CPU 만 활성화하여 테스트를 다시 시작했습니다.


메모리, mobo 또는 CPU인지 확인하는 유일한 방법은 다른 호환 시스템에서 램을 테스트하는 것입니다.
Moab

2
RAM 칩을 옮길 때 문제가 발생하지 않으면 마더 보드가 던져집니다.
Joshua

1
이 메모리를 이중으로 실행하거나 4 (8g) 모듈이있는 경우 SPD (자동)에서 분리하여 타이밍을 약간 조정하여 작동시킬 수 있습니다. 10,11,10,24라고 말하면 11,12,11,32로 조정하고 대신 테스트하십시오. 이것이 100 % 논스톱으로 작동하면 열 문제 나 마더 보드 문제 일 가능성이 줄어 듭니다. 4x8gig 모듈을 사용하는 사람들은 이전에 설명한 문제가 있었으며 전압 조정 지원이 있고 CPU에 구부러진 핀이없는 경우 호환성 목록에없는 물건을 작동시키는 방법이 될 수 있습니다. 테스트하고 우리에게 돌아 오십시오.
Psycogeek

2
"RAM 속도가 느리면 여전히 오류가 발생하지만 테스트가 세 번째 단계에 도달 한 후에 만 ​​발생합니다."이 중 램의 냉각을 테스트하기 위해 추가 단계를 수행하고 있습니까? 램과 전압 조절 curcuit 재료를 가로 질러 공기를 이동시키는 임시 팬이나 외부 팬조차도 열이 문제인지 여부를 테스트 할 수 있습니다.
Psycogeek

타이밍 수정을 제안하는 @Psycogeek +1 일부 RAM 모듈은 타이밍이 갈 때까지 (같은 브랜드 또는 모듈 유형이라도) 다른 모듈과 잘 어울리지 않습니다. OP와 비슷한 문제가 있었고 타이밍을 수동으로 설정하여 해결했습니다.
Amziraro

답변:


18

구성 요소에 결함이있는 것 같지 않고 호환되지 않는 조합을 사용하고 있습니다.

동일한 메모리 버스에 여러 소켓을 설치하면 각 데이터 라인의 커패시턴스가 증가하고 상승 시간이 느려지므로 전환이 늦게 도착하여 잘못 감지 될 수 있습니다. 이 현상은 전기 엔지니어에게 "팬 아웃"으로 알려져 있습니다.

메모리 모듈 내부의 팬 아웃 때문에 더 복잡합니다. "랭크"라고하는 모듈의 DRAM 장치 수와 토폴로지는 병렬로 연결할 수있는 모듈 수에 영향을줍니다.

많은 메모리 소켓을 지원하는 서버 마더 보드에는 실제로 버퍼링 된 메모리가 필요합니다. 버퍼링 메모리는 계단식 버퍼 네트워크를 사용하여 각각의 팬 아웃 (및 캐패시턴스)을 제한합니다. 버퍼 자체에 의해 지연이 발생하지만로드 수에 따라 로그 적으로 만 증가하는 반면 버퍼되지 않은 메모리 커패시턴스는 선형으로 증가합니다.

Wikipedia에서 이에 대해 설명합니다 : https://en.wikipedia.org/wiki/Memory_rank

일부 마더 보드 매뉴얼은 실제로 이런 종류의 것을 부릅니다. 다른 경우에는 RAM 호환성 목록에서 정보를 추론 할 수 있습니다. 예를 들어, ASUS Z170-A 메인 보드는 듀얼 랭크 (설명서에서 DS = 양면이라고 함)를 한 번에 4 개의 단일 랭크 DIMM을 사용하는 기능과는 반대로 해당 보드의 한 번에 2 개의 슬롯에만 사용할 수 있음을 보여줍니다 .

여기에 이미지 설명을 입력하십시오


이것이 문제의 원인이라고 가정하면 SPD를 끄고 느린 상승 / 하강 시간을 보상하기 위해 타이밍 설정을 약간 느리게 조정하는 데 도움이됩니까?
brhans

1
이것이 실제로 올바른지 확실하지 않습니다. 소비자 Haswell 프로세서는 일반적으로 채널당 4 개의 메모리 랭크를 지원하므로 2 개의 메모리 채널에서 4 개의 양면 모듈을 사용할 수 있습니다. 이것이 왜 문제입니까? 이것은 또한 문제가 4GB 장벽 이상에서만 발생한다는 사실을 설명하지 않는 것 같습니다. 또한 마더 보드 설명서 에는 기본 B85 칩셋이 32GB의 메모리를 지원하며 메모리 순위 수에 대한 제한은 언급되어 있지 않습니다.
bwDraco

2
@bwDraco : 메모리 컨트롤러가 CPU에 있어도 마더 보드도 중요합니다. PCB 레이아웃은 이에 영향을 줄 수 있으며, 최적이 아닌 길이 일치는 신호의 위상 마진을 감소시킵니다 (이는 오류가 특정 바이트 또는 비트 위치와 상관되는 이유이기도합니다). 마더 보드 매뉴얼이 순위에 대해 언급하지 않는다고해서 모든 조합이 지원된다는 의미는 아니며, 세부적인 내용이 들어 있지 않은 쓰레기 매뉴얼을 의미합니다.
Ben Voigt

1
@brhans : 문제는 DRAM 내부가 아닌 CPU와 DIMM 간의 전송에 문제가 있기 때문에 중요한 타이밍 매개 변수가 아니라 메모리 클록 주파수입니다. SPD는 일반적으로 서로 다른 클럭 주파수에 해당하는 많은 프로파일을 가지고 있으며, 이들 중 다른 것을 선택하면 완전히 수동으로 만드는 것보다 낫습니다.
Ben Voigt

1
마더 보드 신호 무결성 문제처럼 보입니다. 특히 모듈 자체가 이중 등급 인 경우 더 큰 모듈은 더 작은 모듈보다 핀당 더 높은 정전 용량을 가질 수 있습니다. 순위를 완전히 채울 때이 문제가 발생할 수 있습니다. 모듈이 둘 이상의 순위를 가질 수 있습니다. 따라서 채널당 4 개의 랭크는 2 개의 듀얼 랭크 고밀도 모듈 일 수 있습니다. 이것은 전기적 특성과 마더 보드의 트레이스 라우팅으로 인해 악화 될 수 있습니다. 내 제안 : 다른 마더 보드를 사용해보십시오.
alex.forencich

9

프로세서의 통합 메모리 컨트롤러에 문제가있는 것 같습니다 .

현대 시스템에서 마더 보드는 메모리 모듈과 프로세서 사이의 경로를 제공하는 것 이상으로 메모리 관리에서 실제로 역할을 수행하지 않습니다. 메모리는 프로세서에 직접 연결되어 대기 시간을 최소화합니다. 메모리를 이전 시스템의 프로세서에 연결 하는 " northbridge "는 이제 프로세서 자체의 일부입니다. (펌웨어 또는 PCH는 프로세서가 RAM을 실행하는 방법을 제어 할 수 있지만, 프로세서가 궁극적으로 프로세서의 책임이라고 설명하는 종류의 비트 오류를 ​​일으키는 것은 이치에 맞지 않습니다.) d 이와 같은 상황에서 IMC 결함이 의심됩니다.

실제로, 마더 보드 또는 시스템 펌웨어가 발생한 문제에 대해 책임을지게된다면 매우 놀랐습니다.


구부러진 핀은 어떻습니까?
Michael Hampton

6
@Michael : 핀이 구부러지면 개별 모듈을 테스트하지 못할 수도 있습니다.
Ben Voigt

4

해당 마더 보드의 BIOS에 대한 나쁜 리뷰가 있습니다. BIOS 업데이트를 확인하는 것으로 시작하겠습니다. 마더 보드를 밟지 마십시오.


BIOS가 최신입니다. 분명히 RAM은 "자격을 갖춘"목록에 없지만 많은 다른 모듈과 동일한 타이밍을 가지고 있습니다.
fdmillion

그런 다음 마더 보드를 교체하려고합니다. 그것은 최고가 될 필요는 없습니다. 당신이 감당할 수있는 가격대로 시작해서 가장 많은 리뷰를 가진 것들을 찾으십시오 (읽어보십시오). 사용자 기반이 가장 큰 사용자는 BIOS 및 칩셋 업데이트를 장기간 지원할 가능성이 훨씬 높습니다.
Atoadaso

해당 마더 보드가 한 번에 32GB의 메모리를 올바르게 처리 할 수 ​​있는지 확인 했습니까? 또한, 마더 보드에서 메모리 관리자 칩을 찾고 제대로 처리 할 수있는 메모리 양을 찾을 수 있습니다.
milesrf

1

RAM이 아닌 것처럼 보일 수도 있지만 RAM에 결함이있을 수 있습니다. 최근에 아이스 티와 함께 ​​치명적인 사고가 발생한 홈 서버에 문제가있었습니다.

각 부품을 개별적으로 교체하는 전체 프로세스 (2 CPU, mobo, 전원 공급 장치 및 16GB (2x8GB) RAM의 2 뱅크)를 수행했으며 단일 RAM 뱅크를 단일 CPU로 사용했을 때 모든 것이 잘 테스트되었습니다 ( 토스트 된 1 개의 CPU).

어떤 구성을 사용하든 상관없이 항상 단일 CPU와 RAM 뱅크 (16GB 또는 32GB의 RAM)가 있었을 때 항상 작동했지만 두 번째 CPU를 넣고 RAM을 분할하면 16GB였습니다. 뱅크 당 서버 부팅에 실패했습니다.

RAM 뱅크 하나를 완전히 교체해야만 마침내 부팅되고 제대로 실행되어 그 이후로 계속되었습니다.

tl; dr : @moab이 그의 의견에서 언급했듯이 호환 가능한 시스템의 모든 구성 요소를 테스트 할 때까지 확실하게 말할 수 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.