커널 로그에서 eth0 NIC 링크가 다운 반복 메시지


14

며칠 전부터 반복되는 동일한 종류의 메시지가 발생한다는 것을 알았으며 그 기간 동안 의도적으로 변경 (설치 / 제거) 된 것이 없다고 말할 수 있습니다.

다음은 /var/log/kern.log 메시지 샘플입니다 .

Mar 30 06:32:45 aurora kernel: [566322.867110] e1000e: eth0 NIC Link is Down

Mar 30 06:32:47 aurora kernel: [566325.313634] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

Mar 30 06:32:59 aurora kernel: [566337.632930] e1000e: eth0 NIC Link is Down

Mar 30 06:33:18 aurora kernel: [566356.543664] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None

Mar 30 11:05:47 aurora kernel: [582689.779752] e1000e: eth0 NIC Link is Down

Mar 30 11:05:50 aurora kernel: [582692.174337] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

완전한 로그 파일에서-이 종류의 모든 로그 메시지를 계산할 때-결론을 내릴 수 있습니다.

  • eth0은 몇 시간마다 실패
  • eth0은 처음에는 2 초, 19 초 동안 두 번째로 실패합니다.

내가 말하는 프로덕션 서버입니다.

메일 서버가 프로덕션 상태이고 19 초 동안 네트워크 오류가 발생하여이 문제를 해결하는 방법은 허용되지 않습니까?


1
지금까지 무엇을 확인 했습니까? 케이블이 제대로 연결되어 있고 무해한 상태입니까? 다른 쪽 끝에있는 스위치도 링크가 내려가는 것을 관찰합니까? 주목할 점은 감지 된 링크가 다른 시간에 다르다는 것입니다 (로그에서 흐름 제어가 다릅니다). 아마도 자동 협상이 실패했을까요? 1000Mbps FD Rx / Tx를 강제 실행하면 문제가 해결됩니까?
Håkan Lindqvist

@ HåkanLindqvist 서버가 물리적으로 가까이 있지 않기 때문에 케이블을 확인하는 옵션이 없습니다. 서버 팜 기술에 확인해야 할 것이 있습니까? 1000Mbps FD Rx / Tx를 어떻게 강제합니까? 그리고 흐름 제어가 다른 시간에 다른 점에 대해이 문제가 있습니까?
Miloš Đakonović

시간이 지남에 따라 변화하는 "유형"이라는 링크는 무언가가 옳지 않지만 실제 원인을 찾는 것은 물론 별도의 질문이라는 것을 나에게 제시합니다. 기술 담당자에게 문의하는 것이 좋습니다.
Håkan Lindqvist 2014 년

1
ethtool 또는 mii-tool을 사용하여 서버 쪽에서 자동 협상 상태 등을 확인할 수 있습니다. 서버 스위치가 일치하도록 설정되어 있는지 확인해야합니다. 하드웨어 문제처럼 들립니다. 서버 어댑터, 케이블 또는 스위치 일 수 있습니다. 스위치의 상태를보고 스위치의 작동 상태를 확인하는 것이 좋습니다.
Paul Haldane

답변:


10
  1. 와이어의 오류를 확인하고의 출력에서 ​​"오류"필드를보십시오 ifconfig. 0이 아닌 경우 하드웨어 (케이블, NIC 카드 또는 허브 / 스위치)에 문제가 있습니다. 신뢰할 수없는 이더넷 케이블도이 필드에 오류가 발생합니다.
  2. 1 단계와 상관없이 이더넷 케이블을 교체하십시오.이 방법은 빠르고 저렴하며 간편하며 링크가 임의의 간격으로 올라가거나 내려갈 때마다 수행해야합니다.
  3. 사용 ethtool하고 있는지 확인 네트워크 설정 (양면 인쇄 등) 스위치와 일치합니다. 스위치 관리자가 아닌 경우 네트워크 관리자에게 설정을 제공하도록 요청하십시오.
  4. 스위치에 흐름 제어가 활성화되어 있으면 Linux 상자에서 활성화해야합니다. 그렇지 않으면 비활성화하십시오.

참고로 흐름 제어가 필요한지 평가해야합니다. HP에 따르면 고성능 응용 프로그램에만 필요합니다. 흐름 제어 사용시기에 대한 HP 기사를 참조하십시오.


1
전선 오류였습니다. 오류를보고 한 후 서버 팜 기술이 제대로 작동했습니다.
Miloš Đakonović

1
'ifconfig'에 오류가 표시 되었습니까?
Michael Martinez

1

여기 내 수정이 있습니다. 이 문제는 커널 3.9 정도 이후로 항상 e1000e 드라이버를 사용하여 특정 하드웨어 (NIC의 2 개 포트 중 1 개 포트에서 1 개만)에서 발생합니다. 이 파일은 centos7 용이며 들어가서 /etc/init.d/활성화해야 chkconfig --add <name>합니다. 인터페이스 이름이 하드 코딩되어 있습니다 ... 설정해야합니다.

#!/bin/sh

### BEGIN INIT INFO
# Provides:          pm-e1000e-fix
# Required-Start:    $network
# Required-Stop:     $network
# Default-Start:     2 3 4 5
# Default-Stop:      0 6
# Short-Description: workaround for e1000e issue
# Description:       e1000e fix
### END INIT INFO

################################################################################
# Give Usage Information                                                       #
################################################################################
usage() {
    echo "Usage: $0 start|restart" >&2
    exit 1
}

################################################################################
# E X E C U T I O N    B E G I N S   H E R E                                   #
################################################################################
command="$1"
shift

interface="eth0"

case "$command" in
    start)
        ethtool -K "$interface" gso off gro off tso off
        ;;
    restart)
        ethtool -K "$interface" gso off gro off tso off
        ;;
    *)
        usage
        ;;
esac
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.