프로덕션 IoT 장치의 예외 및 오류 추적?


11

회사는 현재 IoT 장치, 게이트웨이 및 플랫폼에서 오류를 어떻게 추적하고 있습니까? 우리 회사는 모든 장치에서 로그를 집계하기 위해 papertrail 을 사용 하고 있지만 프로덕션에서 오류가 발생하면 여러 시스템 사이에서 긁히는 경우가 종종 있습니다.

한 곳에서 (예 : IoT 플랫폼에서) 발생했을 수 있지만 예외가 발생했을 때 발생하는 예외를 해결할 때 "근본 원인"을 줄일 수있는 방법을 찾고 있습니다. 스택 — 예를 들어 에지 장치의 데이터 오류.

이 영역에서 찾은 내용과 관련하여 SentryRollbar 는 서버 또는 앱의 예외 추적에는 적합하지만 이전 단락에서 설명한대로 계단식 오류를 추적하는 수단은 제공하지 않습니다.

텍스트 로깅보다 더 나은 시스템이 있습니까? 저는 센트리에서 얻은 빵 부스러기 스타일의 이벤트를 사용하려고하지만 분산 시스템을 통해 추적하려고합니다.

답변:


5

분산 추적

가치있는 분산 추적에 대한 아이디어는 이 Google 백서에서 Dapper 솔루션에 대해 가장 일반적으로 설명됩니다 . 나는 그들이 그것을 발명했다고 말하는 것이 아닙니다. 본질적으로 IoT에서도 동일하게 작동하므로 백엔드 또는 엔드 장치의 가장자리에서 추적을 시작하십시오.

Google 백서는 서버 측 시스템에 중점을두고 있지만 최종 장치를 포함하도록 개념을 쉽게 조정할 수 있습니다. Netflix가 최근 오픈 소스로 제공 한 Vizceral 을 통해 모든 시각화를 통해 추적 및 범위 ID를 사용하여 시스템 전체의 모든 정보를 추적하는 마술을 볼 수 있습니다 . 지역보기 에서 블로그에 표시되는 내용은 추적 ID를 통해 통화가 상관되는 실시간 로그 분석을 기반으로합니다. Dapper 백서에서 언급 한 것처럼 Netflix는 API에 대한 호출 패턴을 샘플링했습니다. 구글은 논문에서 1 : 1000을 언급했다. 분명히 Netflix는 이미 요청 유형 중 일부에서 1,010 만에 도달했습니다.

시스템에 대해서는 잘 모르지만 실제로 100 % 추적으로 시작할 수있을 것입니다.

처음부터 추적을 IoT 디바이스와 일치 시키거나 엔드 포인트에서 추적 ID를 작성할 수있는 한, 에지 디바이스를 포함하는 방식으로 이러한 아이디어를 적용하는 데 방해가되지 않습니다.


고마워요 Helmar, 나는 그 지역에서 이미 읽고 있었기 때문에 원래 질문에 Dapper를 언급했으면 좋겠습니다. 확실히 이것을 사용할 수있는 범위가 있지만 이미 사용중인 다른 기존 솔루션이 있는지 확인하고 싶습니까?
17
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.