요약
새로운 하드웨어를 설치 한 후 syslog에 이러한 암호 메시지가 표시되어 문제가 무엇인지, 심각하거나 문제가 무엇인지 파악할 수 없습니다.
그들은 새로운 SATA HBA에서 왔으며 패턴을 따릅니다. 5-30 초 후에 첫 번째 메시지 몇 개와 두 번째 메시지 몇 개를 보게됩니다. 그것들은 모두 같은 초에 기록 된 블롭 (blob)으로 제공되며 각각의 정확한 양은 약 2와 35 사이에서 다릅니다.
두 메시지의 예 :
Jul 13 06:06:23 durandal kernel: [366918.435596] mpt2sas0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
Jul 13 06:06:28 durandal kernel: [366923.145524] mpt2sas0: log_info(0x31110d01): originator(PL), code(0x11), sub_code(0x0d01)
항상 0x31120303 뒤에 0x31110d01이옵니다.
mpt2sas는 내가 사용중인 SATA 호스트 버스 어댑터 용 드라이버이지만 오류 내용이 지나치게 암호화되어 있습니다. 문제가 무엇인지, 어떤 디스크 또는 포트가 있는지 또는 얼마나 심각한 지 알려주지 않습니다.
하드웨어
슈퍼 X9SCL A를 제온 E3-1220 및 RAM의 8기가바이트
LSI SAS2008 기반 Supermicro AOC-USAS2-L8I SAS / SATA HBA는 Supermicro CSE-M35T-1B 디스크 트레이 세트에 연결되었습니다. 3 개의 Western Digital WD30EZRX 와 2 개의 Segate ST3000DM001이 연결되어 있습니다. 모든 3TB 드라이브 (실제로 동일한 수의 섹터). 사용중인 포트 확장기가 없습니다.
HBA, 디스크 트레이 및 4 개의 드라이브가 새로워졌습니다. WD30EZRXes 중 하나는 몇 달 동안 사용되었지만 아무런 문제가 없었습니다. 이전에 내장형 Intel SATA 컨트롤러에 연결했으면이 새로운 설정으로 드라이브 베이로 옮겼습니다.
HBA에 자주 재설정해야하고 실제로 끔찍한 성능을 얻는 데 문제가있었습니다. 펌웨어 / 바이오를 Supermicro에서 제공하는 최신 릴리스 인 "Phase 12"로 업데이트하고 유형을 IT로 변경했습니다 (예 : 모든 소프트웨어 RAID를 사용하려고했기 때문에 IR에서 통합 RAID에 대한 통과) : 2008IT12.FW. 이 업데이트는 모든 초기 문제를 해결했으며 나중에까지 위의 메시지가 표시되지 않았습니다 (아래 참조).
내가 추가 한 처음 4 개의 디스크는 모두 첫 번째 SFF-8087 포트 (4 개의 SATA 케이블로 분리)에 있습니다. 내가 추가 한 최신 디스크는 다른 포트에 있습니다.
시스템의 유일한 다른 디스크에는 OS가 포함되어 있으며 통합 SATA 컨트롤러에 연결된 구형 Intel 80GB SSD입니다.
소프트웨어
우분투 11.10 (oneiric). 리눅스 3.0.0-14 서버 x86_64 OS와 함께 제공되는 mpt2sas 드라이버 사용
5 개의 디스크가있는 Linux md를 사용하여 RAID6 어레이를 구축하려고합니다. 3 개의 디스크, 2 개의 Segate 및 새로운 WD 드라이브 중 하나의 축 퇴형 어레이로 시작했습니다. 펌웨어 업데이트를 수행 한 후 로그에 메시지가 표시되지 않았습니다. 한편, 나는 여전히 같은 컨트롤러의 포트 0에서 이전 WD 디스크를 사용하고 있습니다.
다른 새 WD 디스크를 어레이에 추가했습니다. 재 구축이 시작되었으며 이제 syslog에 해당 메시지가 주기적으로 나타납니다. 디스크를 어레이에 추가하는 데 걸리는 시간이 확실하지 않지만 예상 시간 (cat / proc / mdstat)의 범위는 수천에서 수만 분에 이르며 처음 3 개의 디스크보다 훨씬 깁니다. WD 디스크가 훨씬 느리다는 것을 알고 있습니다. 다중 디스크 오류 가능성을 줄이기 위해 다른 모델을 사용했으며이 두 모델은 가장 저렴한 3TB 모델이었습니다.
노트
SMART는 어떤 디스크에서도 문제를보고하지 않습니다. 디스크에 기록 된 오류가 없으며 오류 통계가 임계 값 근처에 없습니다.
기록 된 메시지는 마지막 디스크를 추가 한 후에 만 나타나기 시작 했으므로 문제가있을 수 있지만 다른 것을 가리키는 것은 없습니다.
이 드라이버의 로깅 메시지에 해당 하는 헤더 파일 을 찾았습니다 . 첫 번째 메시지는 나열되지 않은 "서브 코드"0303에 대한 중단 (코드 12) 인 것으로 보입니다. 두 번째 메시지는 명확하지 않은 이유로 재설정 (코드 11)입니다. 0303과 0d01의 의미를 알 수 있다면 정말 도움이 될 것입니다.
5 디스크 RAID6에 4 개의 디스크가 불완전한 어레이라는 것을 알고 있습니다. 4 번째 디스크 통합이 완료되면 기존 디스크의 내용을 어레이에 복사 한 다음 기존 디스크도 어레이에 추가 할 계획입니다.