드라이브가 고장날 때 HP 서버에서 이메일을 보내려면 어떻게해야합니까?

11

이상적으로는 가능한 한 간단하게 설치하고 서버를 재부팅하지 않아도됩니다. DL380 G5's그것이 도움이된다면 대부분입니다 .

— DrZaiusApeLord
소스

수치가 G7이 아니거나 HP Insight Manager를 사용할 수 있습니다.

— Tom O'Connor

서버에서 Windows 또는 Linux를 실행 중입니까?

— Tom O'Connor

이 서버에서 어떤 운영 체제를 실행하고 있습니까?

— ewwhite

그들은 모두 바닐라와 R2 모두 2003 또는 2008입니다. SIM을 가지고 놀았지만 G5와 대화 할 수 없었습니다.

— DrZaiusApeLord

SIM은 여전히 G5 ProLiants와 호환되어야합니다. 이전에 시도했을 때 에이전트를 설치 했습니까?

— ewwhite

16

이는 서버에서 실행중인 운영 체제에 따라 약간 씩 다르지만 일반적으로 HP ProLiant 서버 및 Smart Array RAID 컨트롤러에서 경고를 얻을 수 있습니다.

DL380 G5 시스템에 대한 전체 드라이버 및 소프트웨어 지원 목록 은 여기에 있습니다 .

SNMP와 모니터링 솔루션이 최선의 방법입니다 ... 그러나 일부 HP 도구를 사용하여이를 강화할 수 있습니다. HP는 다운로드 및 서버와 함께 제공되는 HP Systems Insight Manager 를 제공합니다. 서버 모음에 이상적입니다. 관리 또는 모니터링 인프라를 구축하지 않고 일회성 경고를 찾으려면 HP 관리 에이전트 (일명 ProLiant Support Pack ) 를 설치하면 됩니다.

독립형 Linux 시스템의 경우 에이전트가 전자 메일을 통해 트랩을 보내도록합니다. 일반적으로 지원 팩을 기본값 또는 사용자 정의 번들 로 구성한 다음 수신자 주소를 가리 키도록 행을 편집 /opt/hp/hp-snmp-agents/cma.conf하고 변경합니다 trapemail.

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net

Linux를 실행 중이고 전체 HP 관리 제품군을 설치하지 않으려는 경우 cciss_vol_status 유틸리티 주위에 스크립트를 개발하여 컨트롤러 / 디스크 상태를 쿼리 할 수 있습니다 . OpenFiler에 HP 에이전트 설치 참조

— ewwhite
소스

드라이브를 슬롯에서 꺼내는 것 외에 RAID 어레이 오류에 대한 경고를 테스트하는 우아한 방법이 있습니까? ProLiant DL360 G7서버 가 몇 대 있는데 모니터링을 위해 HP SIM을 설정했습니다.

— Banjer

내가 아는 한에서는 아니다. Insight 에이전트는 확실히 작동합니다. hpacucli 유틸리티를 통해 어레이 상태를 볼 수 있고 HP SIM에서 경고를 수신하고 있다는 것을 알고 있다면 제대로 작동한다고 가정하는 것이 좋습니다.

— ewwhite

5

HP Insight Manager 확인

https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#

서버와 함께 작동해야한다고 생각합니다.

— ckliborn
소스

3

@ewwite가 그의 답변에서 언급 한 경량 프로그램을 사용했습니다 : cciss_vol_status

함께 제공되는 INSTALL 지침을 따르면 스크립트가에 배치됩니다 /usr/local/bin/cciss_vol_status.

다음은 cciss_vol_status의 출력을 grep하고 어레이가 FAILED 상태 인 경우 이메일을 보내는 데 사용하는 래퍼 스크립트입니다.

#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers.  Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`

# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root

# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}

if echo $status | grep -q FAILED
then
    # make sure we haven't sent a notification in the last X minutes
    if test `find ${lockfile} -mmin +${_notification_freq}`
    then
        echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}

        # update lock file mod time
        /bin/touch ${lockfile}
    fi
fi

cron에서 위 스크립트를 호출하십시오. 2 분마다 점검을 실행합니다.

*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh

우리는 HP System Insight Manager 를 사용하여 HP 가 제대로 작동하고 있는지 확인하지만 그 이상은 아닙니다. 우리는 다른 모니터링 솔루션을 가지고 있기 때문에 Linux 에이전트가 우리에게 너무 과한 것으로 나타 났으므로 위의 스크립트는 특정 목적에 잘 부합합니다.

최신 정보

이 문제가 발생할 경우를 대비 한 문제 해결 팁. 이 스크립트는 오늘 아침 실패한 어레이에 대한 이메일을 받았을 때 도움이되었습니다.

캐시 더티 한계에 도달했습니다

장치가 읽기 전용으로되어에 표시되지 않았습니다 /proc/partitions. 서버를 재부팅하고 부팅시 다음 메시지가 표시되었습니다.

가능한 데이터 손실로 인해 논리 드라이브가 비활성화되었습니다. 논리 드라이브를 비활성화하려면 "F1"을 선택하십시오. 데이터 손실을 수용하고 논리 드라이브를 다시 활성화하려면 "F2"를 선택하십시오.

F2를 선택했는데 RAID가 정상이고 부팅시 마운트되었습니다.

— 밴저
소스

1

smartmontools를 설치하십시오. 드라이브가 고장 나기 전에 메일을 보냅니다.

— 스테판
소스

2

~ 30 %의 시간 SMART는 은색 총알 이 아닙니다 .

— HopelessN00b