이상적으로는 가능한 한 간단하게 설치하고 서버를 재부팅하지 않아도됩니다. DL380 G5's
그것이 도움이된다면 대부분입니다 .
이상적으로는 가능한 한 간단하게 설치하고 서버를 재부팅하지 않아도됩니다. DL380 G5's
그것이 도움이된다면 대부분입니다 .
답변:
이는 서버에서 실행중인 운영 체제에 따라 약간 씩 다르지만 일반적으로 HP ProLiant 서버 및 Smart Array RAID 컨트롤러에서 경고를 얻을 수 있습니다.
DL380 G5 시스템에 대한 전체 드라이버 및 소프트웨어 지원 목록 은 여기에 있습니다 .
SNMP와 모니터링 솔루션이 최선의 방법입니다 ... 그러나 일부 HP 도구를 사용하여이를 강화할 수 있습니다. HP는 다운로드 및 서버와 함께 제공되는 HP Systems Insight Manager 를 제공합니다. 서버 모음에 이상적입니다. 관리 또는 모니터링 인프라를 구축하지 않고 일회성 경고를 찾으려면 HP 관리 에이전트 (일명 ProLiant Support Pack ) 를 설치하면 됩니다.
독립형 Linux 시스템의 경우 에이전트가 전자 메일을 통해 트랩을 보내도록합니다. 일반적으로 지원 팩을 기본값 또는 사용자 정의 번들 로 구성한 다음 수신자 주소를 가리 키도록 행을 편집 /opt/hp/hp-snmp-agents/cma.conf
하고 변경합니다 trapemail
.
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' systems@1234.net
Linux를 실행 중이고 전체 HP 관리 제품군을 설치하지 않으려는 경우 cciss_vol_status 유틸리티 주위에 스크립트를 개발하여 컨트롤러 / 디스크 상태를 쿼리 할 수 있습니다 . OpenFiler에 HP 에이전트 설치 참조
ProLiant DL360 G7
서버 가 몇 대 있는데 모니터링을 위해 HP SIM을 설정했습니다.
HP Insight Manager 확인
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
서버와 함께 작동해야한다고 생각합니다.
@ewwite가 그의 답변에서 언급 한 경량 프로그램을 사용했습니다 : cciss_vol_status
함께 제공되는 INSTALL 지침을 따르면 스크립트가에 배치됩니다 /usr/local/bin/cciss_vol_status
.
다음은 cciss_vol_status의 출력을 grep하고 어레이가 FAILED 상태 인 경우 이메일을 보내는 데 사용하는 래퍼 스크립트입니다.
#!/bin/bash
#
# Check status of RAID volumes on HP Smart Array controllers. Send an email
# alert if any volumes have a FAILED status.
#
status=`/usr/local/bin/cciss_vol_status /dev/sd*`
# email lock file
lockfile=/tmp/raid.check.hp.smartarray.lock
# how often to send an email (minutes)
_notification_freq=59
_host=`hostname`
# To: email
_toemail=root
# create email lock file
[ ! -f ${lockfile} ] && /bin/touch ${lockfile}
if echo $status | grep -q FAILED
then
# make sure we haven't sent a notification in the last X minutes
if test `find ${lockfile} -mmin +${_notification_freq}`
then
echo -e "${status}" | /bin/mail -s "System Alert! RAID failure on ${_host}" ${_toemail}
# update lock file mod time
/bin/touch ${lockfile}
fi
fi
cron에서 위 스크립트를 호출하십시오. 2 분마다 점검을 실행합니다.
*/2 * * * * /usr/local/bin/raid.check.hp.smartarray.sh
우리는 HP System Insight Manager 를 사용하여 HP 가 제대로 작동하고 있는지 확인하지만 그 이상은 아닙니다. 우리는 다른 모니터링 솔루션을 가지고 있기 때문에 Linux 에이전트가 우리에게 너무 과한 것으로 나타 났으므로 위의 스크립트는 특정 목적에 잘 부합합니다.
최신 정보
이 문제가 발생할 경우를 대비 한 문제 해결 팁. 이 스크립트는 오늘 아침 실패한 어레이에 대한 이메일을 받았을 때 도움이되었습니다.
캐시 더티 한계에 도달했습니다
장치가 읽기 전용으로되어에 표시되지 않았습니다 /proc/partitions
. 서버를 재부팅하고 부팅시 다음 메시지가 표시되었습니다.
가능한 데이터 손실로 인해 논리 드라이브가 비활성화되었습니다. 논리 드라이브를 비활성화하려면 "F1"을 선택하십시오. 데이터 손실을 수용하고 논리 드라이브를 다시 활성화하려면 "F2"를 선택하십시오.
F2를 선택했는데 RAID가 정상이고 부팅시 마운트되었습니다.