최근에 내가 배치 한 일부 Drupal 사이트에서 다운 타임이 발생했습니다. 서비스 나 서버 자체를 다시 시작하여 이러한 다운 타임에 대응하는 대신 문제에 능동적으로 접근하고 싶습니다. 서버 / 인프라의 상태를 모니터링하기 위해 nagios, munin, cacti 등과 같은 모니터링 도구에 대해 읽었지만 실제로 프로덕션 환경에서는 시도하지 않았습니다. Drupal은 거의 99 %의 시간을 처리하며 서버 수준 모니터링과 Drupal (응용 프로그램 코드) 수준 모니터링에 대한 제안을 찾고 싶습니다.
기본적으로 서버로드가 높으면 범인 (또는 피해자)을 지적하여 정보에 근거한 결정을 내릴 수 있도록 알림을 받고 싶습니다. 또한 PHP 오류 / 경고가있을 때 사람들이 Drupal 레벨 모니터링 (예 : 이메일)에 무엇을 사용하는지 알고 싶습니다. (이메일 서버 자체가 다운되면 어떻게됩니까?)