근본 원인 분석 수행


9

근본 원인 분석을 수행하는 방법에 대해 자세히 알고 싶습니다. 우리 부서는 사용자에게 재부팅 (Windows XP 시스템)을 재 시도하도록 지시하는데, 이는 실제로 많은 문제를 "수정"합니다. 급한 시간에 (때로는 시간당 급여를받는 경우) 실제로 근본 원인 분석을 수행하는 대신 문제를 신속하게 해결하기 위해 해결 방법을 찾으려고 시도 할 수 있습니다.

대부분의 경우이 정보에 대한 로그 파일 또는 이벤트 뷰어를 찾고 있습니다. 때로는 Sysinternals 도구를 사용하거나 때때로 패킷 스니퍼를 실행합니다. 아마도 Sysinternals 프로그램을 사용하지 않을 것입니다. 이 도구를 사용하는 방법, 언제, 왜 도움이되는지에 대한 특정 통찰력.

나는 이것이 광범위한 질문이라는 것을 알고 있지만 사용하는 방법론, 도구 등을 간략하게 설명해 주시겠습니까? SF의 많은 관리자가 더 자세히 알고 싶은 더 심층적 인 프로세스를 사용하는 것 같습니다. 이것이 문제를 좁히는 데 도움이된다면 AD 환경 내의 Windows 서버 및 클라이언트와 관련된 도구, 팁, 트릭 등에 가장 관심이 있습니다.

답변:


5

문제의 근본 원인을 파악하는 것은 문제에 달려 있습니다. 로그 파일 / sysinternals 도구 / 패킷 스니퍼를 보는 최초의 본능은 일반적으로 정확합니다.
Windows 시스템에서 MS 악성 소프트웨어 제거 도구 및 우수한 AV 프로그램을 실행하고 CyberDefender 또는 기타 AV-trojan-malware와 같은 것이 없는지 확인합니다.

Stack Exchange의 사람들은 "5 Whys"방법 ( http://en.wikipedia.org/wiki/5_Whys , 또한 이 문서를 실제로 보여주는 훌륭한 PDF)의 지지자입니다 . 근본 원인 분석을 수행하는 데 매우 유용한 도구입니다.


그 외에도 두 가지 광범위한 범주와 내가 일반적으로 확인하는 질문 / 질문 중 일부를 그립니다.

네트워크와 관련이없는 신비한 행동 (
예 : "워드가 계속 충돌합니다")

기본적인 질문 :

  1. 무엇이 바뀌 었습니까?
    (답을 위해 "아무것도하지"마십시오-그것이 최초의 거짓말입니다. 새로운 소프트웨어, 패치 등은 모두 중요합니다.)
  2. 문제가 생겼을 때 무엇을하고 있었습니까?
    (여기서 가능한 한 상세하게 추출해보십시오. 위의 예에서 " 삽입 이니셜을 위해 핫키를 누르고 프로그램이 중단되었습니다")
  3. 이전에 작동 한 적이 있습니까?
    (그렇다면 위의 (1)에서 내용을 살펴보십시오)
  4. 시스템에서 문제를 재현 할 수 있습니까?
    (그렇다면 좋은 징조입니다. 공급 업체에 대한 기술 지원 요청이 도움이 될 수 있습니다. 그렇지 않은 경우 나머지 질문에 대해서는 사용자 시스템을 살펴 봐야합니다.)
  5. 사용자 환경과 사용자 환경의 차이점은 무엇입니까?
  6. 사용자의 하드웨어가 의심 스러운가 (메모리 테스트 실행, 하드 드라이브의 SMART 오류 등)
  7. 지금까지 확인한 경우 (하드웨어 체크 아웃, 소프트웨어 체크 아웃, 바이러스 없음, 맬웨어 없음) 하루 동안 사용자를 방문하십시오. 그들의 작업 습관을 관찰하십시오.
    우리 회사는 한때 특정 주파수에서 마우스를 클릭하는 것과 관련된 신비한 시스템 잠금을 가지고있었습니다. 확실하게)

네트워크 관련 문제

이것의 대부분은 비슷하지만 좀 더 구체적인 지침이 있습니다.

  1. 무엇이 바뀌 었습니까?
    (예, 당신은 항상 거기에서 시작합니다)
  2. 깨진 무엇입니까?
    • 웹 페이지에 접속할 수 있습니까? 다운 된 것입니까? 그렇다면 모두 또는 당신만을위한 것 입니까?
    • 인터넷에서 물건을 이름으로 핑할 수 있습니까?
      IP는 어떻습니까? traceroute는 얼마나 먼가?
  3. 언제 고장?
    • 항상 같은 시간?
    • N 일마다 짧은 기간 동안?
    • 무작위로 ( 정말 무작위입니까? 달력에 플롯하십시오 ...)
  4. 원격 사이트에 이상한 점이 있습니까?
    • DNS 살펴보기-라운드 로빈 인 경우 원격 측 손상이있을 수 있습니다.
    • VPN의 다른 쪽 끝에 대해 ​​이야기하고 있습니까? VPN은 어떤가요?
  5. 로컬 사이트에 이상한 점이 있습니까?
    • 로컬 방화벽 확인
    • "필터링 소프트웨어"확인
  6. 알려진 문제가 있는지 ISP에 확인하십시오.
  7. http://www.internetpulse.net/ 과 같은 사이트 에서 알려진 네트워크 전체 문제를 확인하십시오.
  8. 사용자 기기를 확인하십시오
    (TCP 설정 등-일반적으로 문제는 아니지만 때때로).

1

지금까지 훌륭한 응답 외에도 다음을 추가합니다.

  • 문제가 발생한 날짜 / 시간을 식별하십시오. 이것은 명백해 보일 수도 있지만, 이것이 문서화되지 않았고 나중에 잘못된 가정에 대한 너무 많은 문제를 보았습니다. 이것은 "변경된"단계와 관련이 있습니다.

  • 문제가 재현 가능하거나 간헐적입니까? 재현 가능한 증상이 간헐적 인 증상보다 훨씬 쉽고 빠르게 해결되므로 이는 중요합니다. 재현 가능한 경우 단계가 문서화되어 있는지 확인하십시오.

  • 증상을 확인하십시오. 근본 원인의 징후 인 "증상"과 실제 문제 / 근본 원인을 구분합니다.

    1. 증상을 재현 할 수있는 다른 활동이 있습니까?
    2. 다른 증상은 무엇입니까?
    3. 문제가 간헐적으로 발생하는 경우 문제를 일으킬 수있는 활동을 식별 할 수 있습니까?
    4. 어떤 상황에서 증상이 발생하지 않도록 할 수 있습니까? 네트워크 계정을 사용하여 로그온 한 경우에만 문제가 발생하지만 로컬로 로그온 한 경우에는 정상적으로 작동합니까? 일반 사용자로 로그인 할 때 문제가 발생하지만 관리자 권한으로 로그온 한 경우에는 정상적으로 작동합니까? 한 시스템에서만 발생하지만 비슷한 다른 시스템에서 증상이 나타나지 않습니까?
  • 문제가있을 수있는 기능적 구성 요소로 문제를 지역화하십시오. 웹 응용 프로그램에 오류가있는 경우 응용 프로그램 코드, 웹 서버, 웹 서버를 호스팅하는 운영 체제, 네트워크 또는 원격쪽에 오류가 있습니까? 자원이 가능한 원인에 초점을 맞추기 위해이 시점에서 가장 잘 추측됩니다. 따라서 다른 사람들이 이것이 이론 / 추론임을 알도록하십시오.

  • 가정에 의문을 제기하고 가정과 결론을 뒷받침 할 수 있도록 실증적 데이터를 수집하십시오. x에 문제가 없다고 누군가에게 말하면 기분이 나쁘고 나중에 실제로 발견됩니다. 일반적으로 잘못된 솔루션이있는 경우 올바른 솔루션을 지원하기위한 데이터가있을 수 있습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.