회귀에 가우시안 프로세스 (GP)를 사용하고 있습니다.
내 문제에서 두 개 이상의 데이터 포인트 가 상대적으로 길이에 상대적으로 가깝습니다. 문제의 규모. 또한 관측에 소음이 심할 수 있습니다. 계산 속도를 높이고 측정 정확도를 높이려면 더 큰 길이의 예측에 관심이있는 한 서로 가까운 지점의 클러스터를 병합 / 통합하는 것이 자연스러워 보입니다.
나는 이것을 수행하는 빠르고 반 원리적인 방법이 무엇인지 궁금합니다.
두 개의 데이터 포인트가 완전히 겹치면 이고 관측 노이즈 (즉, 가능성)는 가우시안 (Gaussian) 일 수 있습니다 . 자연스러운 진행 방법은 다음과 같은 단일 데이터 포인트로 병합하는 것 같습니다.
에 대해 .
관측 값 , 관측 값의 평균 의 상대 정밀도로 가중치 부여 : .
관측치와 관련된 잡음 : .
그러나 가까이 있지만 겹치지 않는 두 점을 어떻게 병합해야 합니까?
는 여전히 두 위치 의 가중 평균 이어야 한다고 생각합니다 . 다시 상대적인 신뢰도를 사용하십시오. 이론적 근거는 질량 중심 논쟁이다 (즉, 매우 정밀한 관측을 덜 정밀한 관측의 스택으로 생각한다).
용 위와 같은 식.
관측과 관련된 노이즈의 경우 위의 수식 외에도 데이터 포인트를 이동하기 때문에 노이즈에 교정 항을 추가해야하는지 궁금합니다. 본질적으로 및 (각각 공분산 함수의 신호 분산 및 길이 스케일)와 관련된 불확실성이 증가 합니다. 이 용어의 형태는 확실하지 않지만 공분산 함수를 사용하여 계산하는 방법에 대한 임시 아이디어가 있습니다.
계속 진행하기 전에 이미 무언가가 있는지 궁금했습니다. 그리고 이것이 합리적인 진행 방법으로 보이거나 더 빠른 방법 이 있다면 .
내가 문헌에서 찾을 수있는 가장 가까운 것은이 논문입니다 : E. Snelson와 Z. Ghahramani은 의사 입력을 사용하여 스파 스 가우시안 프로세스는 , '05 일본군; 그러나 그 방법은 (상대적으로) 관련되어 있으며 의사 입력을 찾기 위해 최적화가 필요합니다.