에서 /var/log/kern.log
:
kernel: [13291329.657499] EDAC MC0: 48 CE error on CPU#0Channel#2_DIMM#0 (channel:2 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
edac
메모리 중 하나에 ce
오류 가있는 로그 입니다.
edac doc 을 읽었습니다
Dual channels allows for 128 bit data transfers to the CPU from memory.
Some newer chipsets allow for more than 2 channels, like Fully Buffered DIMMs
(FB-DIMMs). The following example will assume 2 channels:
Channel 0 Channel 1
===================================
csrow0 | DIMM_A0 | DIMM_B0 |
csrow1 | DIMM_A0 | DIMM_B0 |
===================================
===================================
csrow2 | DIMM_A1 | DIMM_B1 |
csrow3 | DIMM_A1 | DIMM_B1 |
===================================
오류 채널을 찾으십시오.
$ grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count
/sys/devices/system/edac/mc/mc0/csrow0/ch0_ce_count:0
/sys/devices/system/edac/mc/mc0/csrow0/ch1_ce_count:0
/sys/devices/system/edac/mc/mc0/csrow0/ch2_ce_count:144648966
/sys/devices/system/edac/mc/mc0/csrow1/ch0_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow0/ch0_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow0/ch1_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow0/ch2_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow1/ch0_ce_count:0
/sys/devices/system/edac/mc/mc1/csrow1/ch1_ce_count:0
그리고 mc0/csrow0/ch2
문서처럼 DIMM은 다음 DIMM_C0
과 같아야하며 다음 과 같이 찾을 수 있습니다 dmidecode
.
그러나이 DIMM을 찾을 수 없으므로 어떤 메모리에 문제가 있는지 모르겠습니다.
$ dmidecode -t memory | grep 'Locator: PROC'
Locator: PROC 1 DIMM 2A
Locator: PROC 1 DIMM 1D
Locator: PROC 1 DIMM 4B
Locator: PROC 1 DIMM 3E
Locator: PROC 1 DIMM 6C
Locator: PROC 1 DIMM 5F
Locator: PROC 2 DIMM 2A
Locator: PROC 2 DIMM 1D
Locator: PROC 2 DIMM 4B
Locator: PROC 2 DIMM 3E
Locator: PROC 2 DIMM 6C
Locator: PROC 2 DIMM 5F
12 개의 슬롯이 있으며 9 개의 슬롯에는 메모리가 있습니다.
그렇다면 어떤 메모리에 문제가 있는지 어떻게 알 수 있습니까?
보충:
System Information
Manufacturer: HP
Product Name: ProLiant DL180 G6
어떤 서버 유형입니까? 서버 제조업체 및 모델.
—
ewwhite
@ewwhite, 안녕하세요, 시스템 정보로 질문을 업데이트했습니다.
—
Tanky Woo
어떤 운영 체제를 실행하고 있습니까?
—
ewwhite
@ewwhite OS는
—
Tanky Woo
Ubuntu 12.04
, 커널은3.10.20
오, 미안 해요 ... 우분투 정말이 하드웨어에서 지원되지 않습니다 , 당신은 RHEL을 사용하지 않음으로써 제대로 모니터링 할 수있는 기능을 잃고 있도록 / CentOS는 / 데비안 / 수세 ...
—
ewwhite