귀하의 환경이 PHP 인 동안 Java에 대해 생각하는 방법에 대한 프레젠테이션을했습니다 : http://www.infoq.com/presentations/maintaining-production-java-apps
핵심 문제는 동일합니다. 네트워크, 파일 시스템 액세스, 로그 파일, 교착 상태 등과 같은 상황을 해결할 수있는 초크 포인트를 이해하는 것입니다. 또한 올바른 질문을하는 방법을 알고 있어야합니다. "시스템 다운"- "특히 구체적으로 무엇을하십니까? 평균 : 웹 페이지가 느리거나 특정 오류 메시지가 있습니까? 시간 초과가 있습니까? "등
네트워크 문제 해결을위한 Wireshark는 절대적으로 최고이며 배우는 것이 좋습니다. 다른 것은 사용하는 O / S에 따라 다릅니다. Windows의 경우 SysInternal (현재 Microsoft의 일부)의 모든 것이 훌륭합니다. Unix / Linux의 경우, truss / strace를보십시오.
프로덕션에 액세스 할 때 운영 그룹은 해당 도구 / 기술을 사용하는 방법을 알고 있거나 사용 방법을 배우기위한 비즈니스 사례가 있어야합니다. 그런 다음 문제가 발생할 때 실행할 특정 문제 해결 프로토콜 세트가 필요하므로 분석을 오프라인으로 수행 할 수 있습니다.