syslog에“mce : [하드웨어 오류] : 컴퓨터 검사 이벤트가 기록되었습니다 "가 나타납니다. 어떻게해야합니까?


19

최신 버전의 OSSEC (2.8.1) 을 설치했으며 전자 메일 알림도 활성화했습니다. 그리고 나는 하드웨어 오류와 mce에 관한 무언가가 있다고 말하는 이런 종류의 알림을 많이 받고 있습니다.

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

이것이 정확히 무엇을 의미합니까? MCE는 무엇을 의미합니까? 그리고이 명백한 하드웨어 오류는 내가 걱정해야 할 것이 있습니까?


OS 정보 :

Description:    Ubuntu 14.10
Release:    14.10

당신은 OSSEC에 읽는 조금을 할 필요가 규칙을 볼 수 - ossec-docs.readthedocs.org/en/latest/manual/rules-decoders을 . 웹 인터페이스는 ossec.net/wiki/index.php/OSSECWUI:Install
Panther


ossec은 우분투 리포지토리에 없기 때문에 제대로 지원되지 않거나 주제를 벗어난 것 같습니다
Panther

1
이것은 OSSEC에 관한 것이 아닙니다. OSSEC이 syslog에서 "error"라는 단어를 찾았 기 때문에이 알림을 받았습니다. 나는 그것이 주제에 맞지 않다고 생각하지만, Unix & Linux 또는 Server Fault에서 더 많은 도움을받을 것입니다 .
Eric Carvalho

4
@ bodhi.zazen 주제에 관한 모든 것은 Ubuntu에서 실행됩니다. 그렇다고해서 물론 대답을 얻을 수 있다는 의미는 아닙니다.
세스

답변:


23

기계 점검 예외 :

기계 체크 예외 (MCE)는 컴퓨터의 중앙 처리 장치가 하드웨어 문제를 감지 할 때 발생 컴퓨터 하드웨어 오류의 유형입니다.

컴퓨터에 하드웨어 오류가 발생했으며 커널이 이벤트를 버퍼에 기록했습니다. mcelog기계 점검 이벤트를 기록하고 보는 데 사용할 수 있습니다 . 에서 mcelog :

X86 CPU는 CPU에서 머신 체크 이벤트 (MCE)로 감지 된 오류를보고합니다. CPU 캐시, 내장 메모리 컨트롤러에 의해 주 메모리, 전면 버스 또는 CPU 상호 연결의 데이터 전송 오류 또는 기타 내부 오류에서 데이터 손상이 감지 될 수 있습니다. 가능한 원인은 우주 방사선, 불안정한 전원 공급 장치, 냉각 문제, 하드웨어 고장, 시스템 실행 사양 미달 또는 불운 일 수 있습니다.

대부분의 오류는 내부 오류 수정 메커니즘을 통해 CPU에서 수정할 수 있습니다. 수정되지 않은 오류로 인해 시스템 검사 예외가 발생하여 프로세스가 종료되거나 시스템 패닉이 발생할 수 있습니다. 적은 수의 수정 된 오류는 일반적으로 걱정할만한 원인이 아니지만 많은 수는 향후 실패를 나타낼 수 있습니다.

수정되거나 복구 된 오류가 발생하면 x86 커널은 MCE를 설명하는 레코드를 / dev / mcelog 장치를 통해 사용 가능한 내부 링 버퍼에 기록합니다. mcelog는 / dev / mcelog에서 오류를 검색하여 사람이 읽을 수있는 형식으로 디코딩하여 표준 출력 또는 선택적으로 시스템 로그에 인쇄합니다.

충돌이 발견되지 않으면 오류가 성공적으로 수정 된 것입니다. 여전히 mcelog이러한 이벤트를 추적 하려면 설치 하는 것이 좋습니다.

sudo apt-get install mcelog

이벤트가에 기록됩니다 /var/log/mcelog. 다음을 실행할 수도 있습니다.

sudo mcelog --client

mcelog데몬에 오류가 있는지 쿼리합니다 .


2
나는 MCE 오류가 그냥 ... 시스템 로그에 직접 아마도 작성되지 않은 이유를 궁금해 일부 어쩌면 좋은 이유,
Xen2050

2
@ Xen2050 메시지의 디코딩은 아키텍처에 따라 다르며 하드웨어 제조업체가 항상 문서화하지는 않습니다. PCIe 버스에서도 오류가 발생할 수 있습니다.
Mircea Vutcovici

4
@ Xen2050 : Fedora 25 컴퓨터에서 MCE 메시지가 저널에 기록됩니다 journalctl -b.
Martin Ueding 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.