계속해서 깜짝 놀림 : 권장 단계를 따른 후 호스트 어댑터 중단 요청 오류


9

I / O가 높은 새 Adaptec RAID 컨트롤러에서 호스트 어댑터 중단 요청 오류가 발생했습니다. Adaptecs 조차도 / sys / block / sdX / device / timeout 값을 45로 설정하면 문제가 해결되는 여러 포럼을 읽었습니다 . 그러나 기본적 으로이 값이 45 인 Ubuntu Server 12.04를 실행 중입니다. 또한 mobo의 바이오스를 최신으로 업데이트하는 다음 제안을 시도했습니다.

이 단계를 수행 한 후에도 다른 사람이이 "aacraid : Host adapter abort request"오류를 겪었는지 확실하지 않습니다.

이것이 내 syslog에 표시되는 내용입니다.

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

여기 내 uname -a

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

모두 감사합니다

답변:


1

아직이 문제를 해결하지 못한 경우 최근에 IO가 증가함에 따라 몇 분 동안 5 분마다 배열이 멈추는 것과 동일한 문제가 발생했습니다. 우분투는 기본적으로 CFQ 스케줄러를 사용하는데, 이는 하드웨어 RAID에 최적이 아닙니다. 다음을 사용하여 스케줄러를 noop로 전환하십시오.

echo noop > /sys/block/<blockdevice>/queue/scheduler

개인적으로 오래된 커널이 붙어 있지만 최신 aacraid 드라이버로 업그레이드하여 문제를 해결해야한다고 들었습니다.하지만 확인할 수는 없습니다. 그러나 그럼에도 불구하고 noop로 전환하십시오. sysfs는 영구적이지 않기 때문에 스케줄러를 설정 /etc/rc.local하거나 elevator=부팅 매개 변수를 사용할 수 있습니다 .

다른 커널 매개 변수와 Ubuntu의 설정은 대부분의 일반적인 하드웨어에 대한 합리적인 기본값이지만 대부분의 경우 서버는 배포판에 관계없이 특별한주의가 필요합니다.


1

Adaptec RAID 컨트롤러에 자체 펌웨어 / BIOS가있는 경우이를 업데이트해야 할 수 있습니다. 우리는 높은 I / O 동안 문제를 겪고 있었으며 "aacraid : Host adapter abort request"도 얻었으며 현재 "I / O 스트레스가 높을 때 펌웨어가 멈출 수있는 문제를 해결했습니다." http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf .

위의 릴리스 노트에는 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445와 같은 Adaptec 모델이 나열되어 있습니다.

또한 다음과 같은 로그 라인이 있습니다.

sd 0:0:0:0: timing out command, waited 360s

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

비슷한 문제가있는 다른 사람들을 찾기 위해 온라인 검색에서 관련 문제가있을 수있는 펌웨어로 다음과 같은 문제가 해결 된 다른 카드를 발견했습니다.

위의 두 가지는 Adaptec 모델 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q 및 81605ZQ에 적용됩니다.


arcconf명령 행 유틸리티를 사용하여 일반 Nagios 모니터링 스크립트의 일부로 어레이의 상태를 쿼리 할 때 컨트롤러가 중단 될 것으로 생각 합니다. 펌웨어 메모에 표시된대로 사용 arcconf하면 컨트롤러가 정지 될 수 있습니다.
Stefan Lasiewski
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.