여러 센서 스트림에서 최신 데이터 포인트의 벡터를 가져 와서 유클리드 거리를 이전 벡터와 비교하는 알고리즘을 연구 중입니다. 문제는 서로 다른 데이터 스트림이 완전히 다른 센서에서 온 것이므로 간단한 유클리드 거리를 사용하면 일부 값이 크게 강조됩니다. 분명히 데이터를 정규화 할 수있는 방법이 필요합니다. 그러나 알고리즘은 실시간으로 실행되도록 설계되었으므로 정규화에서 모든 데이터 스트림에 대한 정보를 전체적으로 사용할 수 없습니다. 지금까지 시작 단계에서 각 센서에서 볼 수있는 가장 큰 값 (처음 500 개의 데이터 벡터)을 추적 한 다음 해당 센서의 모든 미래 데이터를 해당 값으로 나누었습니다. 이것은 놀랍게 잘 작동하지만 매우 우아합니다.
나는 이것에 대한 기존 알고리즘을 찾는 데 많은 운이 없었지만 아마도 올바른 장소를 찾지 않을 것입니다. 누구나 알고 있습니까? 아니면 어떤 아이디어가 있습니까? 나는 실행 평균 (아마 Wellford의 알고리즘으로 계산)을 사용하라는 제안을 보았지만, 그렇게하면 동일한 값의 여러 판독 값이 동일하게 표시되지 않을 것입니다. 뭔가 빠졌습니다. 모든 의견을 부탁드립니다! 감사!