그라디언트 기반 최적화와 유전자 알고리즘의 조합을 사용하여 로그 최대의 전역 최대 값을 찾아 MAP 추정을 강력하게 수행 할 수있는 고차원 추론 문제 (약 2000 개의 모델 매개 변수)를 연구하고 있습니다.
MAP 추정값을 찾는 것 외에도 모델 매개 변수에 대한 불확실성을 추정 할 수 있기를 바랍니다.
우리는 매개 변수와 관련하여 로그 포 그라운드의 기울기를 효율적으로 계산할 수 있으므로 장기적으로 우리는 해밀턴 MCMC를 사용하여 샘플링을 수행하는 것을 목표로하고 있지만 현재는 비 샘플링 기반 추정에 관심이 있습니다.
내가 아는 유일한 접근 방식은 후변을 다변량 법선으로 근사하기 위해 모드에서 Hessian의 역을 계산하는 것입니다. 그러나 우리가 계산하더라도 Hessian의 요소 나는 우리가 그 역을 찾을 수 없을 것이라고 확신합니다.
이런 경우에 어떤 종류의 접근 방식이 일반적으로 사용되는지 제안 할 수 있습니까?
감사!
편집 -문제에 대한 추가 정보
배경
이것은 큰 물리학 실험과 관련된 역 문제입니다. 우리는 일부 물리적 필드를 설명하는 2D 삼각 메쉬를 가지고 있으며 모델 매개 변수는 메쉬의 각 정점에서 해당 필드의 물리적 값입니다. 메쉬에는 약 650 개의 정점이 있으며 3 개의 필드를 모델링하므로 2000 개의 모델 매개 변수가 제공됩니다.
우리의 실험 데이터는 이러한 필드를 직접 측정하지는 않지만 필드의 복잡한 비선형 함수 인 수량에 대한 것입니다. 각기 다른 계측기마다 모델 파라미터를 실험 데이터의 예측에 매핑하는 예측 모델이 있으며, 예측과 측정 값의 비교는 로그 우도를 산출합니다.
그런 다음이 모든 다양한 계측기의 로그 우도를 요약하고 필드에 물리적 제약을 적용하는 로그 우선 값을 추가합니다.
결과적으로이 '모델'이 카테고리로 깔끔하게 분류되는 것은 의심의 여지가 있습니다. 우리는 모델이 무엇인지 선택할 수 없으며 실제 데이터가 실험 데이터를 수집하는 기능에 따라 결정됩니다.
데이터 세트
데이터 세트는 500x500 이미지로 구성되며 각 카메라마다 하나의 이미지가 있으므로 총 데이터 포인트는 500x500x4 = 입니다.
오류 모델
우리는 문제의 모든 오류를 현재 가우스로 간주합니다. 어떤 시점에서 나는 약간의 유연성을 위해 학생 t 오류 모델로 이동하려고 시도 할 수 있지만 가우시안만으로는 여전히 잘 작동하는 것처럼 보입니다.
가능성 예
이것은 플라즈마 물리학 실험이며, 대부분의 데이터는 렌즈 앞에 특정 필터가있는 플라즈마를 가리키는 카메라에서 비롯됩니다.
데이터를 재현하기 위해 두 단계가 있습니다. 먼저 메쉬의 플라즈마에서 나오는 빛을 모델링 한 다음 카메라 이미지로 다시 모델링해야합니다.
불행히도 플라즈마에서 나오는 빛을 모델링하는 것은 효과적으로 계수가 무엇인지에 달려 있습니다. 이 비율은 값 비싼 수치 모델에 의해 예측되므로 출력을 그리드에 저장 한 다음 보간하여 값을 찾아야합니다. 속도 함수 데이터는 한 번만 계산됩니다. 코드를 저장하면 스플라인을 저장 한 다음 스플라인을 작성하여 스플라인을 모든 함수 평가에 사용합니다.
과 가 속도 함수 (보간법으로 평가) 라고 가정 하면 메쉬 의 번째 정점 에서의 방출 는
여기서 는 메쉬에서 모델링하는 3 개의 필드입니다. 카메라 이미지로 방출되는 벡터를 얻는 것은 쉬운 일 입니다. 각 카메라 픽셀이 보는 메시 부분을 인코딩 하는 행렬 를 곱하면 됩니다.
오류가 가우시안이므로이 특정 카메라의 로그 가능성은
여기서 는 카메라 데이터입니다. 총 로그 우도는 위의 표현 중 4 가지를 합한 것입니다. 그러나 다른 카메라에서는 광 스펙트럼의 다른 부분을보고 있기 때문에 의 다른 버전의 레이트 함수를 있습니다.
이전 예
우리는 다양한 양에 대해 특정 상한과 하한을 효과적으로 설정하는 다양한 사전을 가지고 있지만, 문제에 대해 너무 강하게 작용하지는 않습니다. 우리는 Laplacian 타입의 스무딩을 효과적으로 필드에 적용하는 강력하게 작용하는 하나의 사전이 있습니다. 또한 가우시안 형식도 사용합니다.