논문에서 가우스 프로세스 회귀 방정식의 도출에 대한 의심


9

나는 이 논문 프리 프린트를 읽고 있으며 가우시안 프로세스 회귀에 대한 방정식의 도출에 어려움을 겪고있다. 그들은 Rasmussen & Williams 의 설정 및 표기법을 사용합니다 . 따라서 가산 성, 제로 평균, 고정 및 정규 분포 노이즈σnoise2 가정 :

y=f(x)+ϵ,ϵN(0,σnoise2)

평균이 0 인 GP는 f(x), 의미하는 것은  dN, f={f(x1),,f(xd)} 평균 0과 공분산 행렬을 가진 가우스 벡터입니다.

Σd=(k(x1,x1)k(x1,xd)k(xd,x1)k(xd,xd))

이제부터는 하이퍼 파라미터가 알려져 있다고 가정합니다. 그러면 논문의 식 (4)가 분명합니다.

p(f,f)=N(0,(Kf,fKf,fKf,fKf,f))

여기에 의심이 온다 :

  1. 식 (5) :

    p(y|f)=N(f,σnoise2I)

    E[f]=0그러나 나는 추측한다 E[y|f]=f0 내가 조건을 할 때 f그런 다음 여기서 는 상수 벡터이며 만 임의입니다. 옳은?y=c+ϵcϵ

  2. 어쨌든, 그것은 식 (6)입니다.

    p(f,f|y)=p(f,f)p(y|f)p(y)

    그것은 베이 즈 정리의 일반적인 형태가 아닙니다. 베이 즈 정리는

    p(f,f|y)=p(f,f)p(y|f,f)p(y)

    두 방정식이 같은 이유를 이해합니다. 직관적으로 응답 벡터 는 대응하는 잠복 벡터 에만 의존 하므로 또는 는 같은 분포를 가져야합니다. 그러나 이것은 직관이지 증거가 아닙니다! 왜 그런지 보여줄 수 있습니까?yff(f,f)

    p(y|f,f)=p(y|f)

답변:


1
  1. 고치면 모든 불확실성 은 노이즈에서 비롯됩니다. 따라서이 기사에서 식 (5)에 대해 우리는 가 주어 졌을 때 각 점에서 분산 이고 평균 0 인 독립 노이즈 집니다. 초기 평균을 더하고 답을 얻습니다.fyfσnoise20
  2. 제안 된 평등을 증명하는 한 가지 방법 의 분포를 찾을 수 있습니다 품질의 왼쪽과 오른쪽에 있습니다. 둘 다 가우시안입니다. 왼쪽에는 이미 답이 있습니다. 오른쪽도 비슷한 방식으로 진행됩니다. 대한 조건부 분포를 찾으십시오 . 첫 번째 부분의 결과에서 알 수 있습니다 : 확률 규칙을 사용하여 쉽게 알아 통합하는 행
    p(y|f,f)=p(y|f)
    (y,y)
    p(y,y|f,f)=N((f,f),σnoise2I).
    y(y,y)공분산 행렬이 대각선이므로 벡터 및 는 독립적입니다. 이렇게하면 yy
    p(y|f,f)=N(f,σnoise2I)=p(y|f).
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.