가우스 프로세스 모델의 주요 장점


11

가우스 프로세스는 특히 에뮬레이션에서 널리 사용되었습니다. 계산 요구가 높다는 것이 알려져있다 ( ).0(n3)

  1. 무엇이 인기가 있습니까?
  2. 그들의 주요 장점과 숨겨진 장점은 무엇입니까?
  3. 왜 파라 메트릭 모델 대신에 그것들이 사용 되는가? (파라 메트릭 모델 I에 의해 입력 파라메터와 출력 트렌드를 설명하기 위해 다른 파라 메트릭 형태를 사용할 수있는 전형적인 선형 회귀를 의미합니다 (예 : qaudratic))?

가우시안 프로세스를 독특하고 유리하게 만드는 고유 속성을 설명하는 기술적 답변에 정말 감사하겠습니다.


파라 메트릭 모델이 무엇을 의미하는지 명확히 할 수 있습니까?
Alexey Zaytsev

@Alexey 나는 위의 paramtric model이 의미하는 바를 명확히했다. 감사합니다
Wis

파라 메트릭 모델에 대한 가정에서 각 문제에 대해 모델을 직접 지정해야합니다. 진정한 본질이 항상 알려진 것은 아니기 때문에 항상 가능하지는 않습니다. 또한 이러한 모델의 피팅에 어려움이있을 수 있지만 가우시안 프로세스의 경우 매개 변수 추정이 거의 매번 잘 작동합니다.
Alexey Zaytsev

4
스플라인 및 선형 회귀는 적절한 공분산 함수가 선택된 가우시안 프로세스 회귀와 같습니다. 그러나 가우시안 프로세스는 많은 작업에 적합한 편리한 확률 적 프레임 워크를 제공합니다.
Alexey Zaytsev

1
언제 Gaussian Process을 사용하지 않습니까?
Alby

답변:


6

주요 장점은 엔지니어링 관점에서 (@Alexey가 언급 한) 것입니다. 널리 사용되는 Kriging 절차 에서는 거리와 방향에 따라 관계에 대한 "상관"(또는 공분산) 모델 (일반적으로 variogram ellipsoid 라고 함)을 제공하여 자신의 "공간"을 해석 할 수 있습니다 .

다른 방법론이 동일한 기능을 갖는 것을 막는 것은 없습니다. 크 래깅이 처음 개념화 된 방식은 통계학자가 아닌 사람들에게 친근한 접근 방식을 가졌습니다.

오늘날 Sequential Gaussian Simulation 과 같은 지질 통계학 기반 확률 론적 방법론이 부상함에 따라 이러한 절차는 불확실성 공간을 정의하는 것이 중요한 분야에서 사용되고 있습니다 (수천에서 수백만 개의 치수가 걸릴 수 있음). 다시 엔지니어링 관점에서, 지질 통계 기반 알고리즘은 유전자 프로그래밍 에 포함하기가 매우 쉽습니다 . 따라서 역 문제가 발생 하면 여러 시나리오를 테스트하고 최적화 기능에 대한 적응성을 테스트해야합니다.

이 주장의 현대적인 실제 사례에 대한 사실을 잠시 동안 순수한 주장으로 남겨 두자. 지하 샘플을 직접 샘플링 (하드 데이터)하거나 지하 표면의 지진 맵 (소프트 데이터)을 만들 수 있습니다.

하드 데이터에서는 (ish) 오류없이 직접 속성 (즉, 음향 임피던스)을 측정 할 수 있습니다. 문제는 이것이 드물고 비싸다는 것입니다. 반면에, 당신은 문자 그대로 음 표면의 부피, 픽셀 단위의 맵이지만 음향 임피던스를 제공하지 않는 지진 매핑을 가지고 있습니다. 간단하게하기 위해 두 가지 음향 임피던스 값 (상단 및 하단) 사이의 비율을 제공한다고 가정 해 봅시다. 따라서 0.5의 비율은 1000/2000 또는 10,000 / 2,000의 나눗셈 일 수 있습니다.이 솔루션은 여러 솔루션 공간이며 여러 조합이 수행하지만 하나만 정확하게 현실을 나타냅니다. 이 문제를 어떻게 해결합니까?

방법 지진 반전 작업 (확률 절차) 그럴듯한를 제조하는 것이다 (이 모두 서로 다른 스토리) 음향 임피던스 (또는 다른 특성)의 시나리오는 (이전의 예에서의 비와 같은) 합성 지진에 그 시나리오를 변화시키고 합성 지진과 실제 지진을 비교하십시오 (상관). 최상의 시나리오는 더 많은 시나리오를 만들어 솔루션으로 수렴하는 데 사용됩니다 (이것은 쉽지 않습니다).

이것을 고려하고 유용성의 관점에서 말하면 다음과 같은 방법으로 질문에 대답합니다.

1) 그것들을 인기있게 만드는 것은 유용성, 구현 유연성, 여러 분야 (특히 지구 과학, GIS 포함)에 대해 더 새롭고 적응 가능한 가우스 기반 절차를 계속 유지하는 많은 연구 센터 및 기관입니다.

2) 주요 장점은 앞에서 언급했듯이 내 관점에서 유용성과 유연성입니다. 조작하기 쉽고 사용하기 쉬운 경우 그냥 사용하십시오. 가우스 프로세스에는 다른 방법론 (통계 또는 기타)에서는 재현 할 수없는 특정 기능이 없습니다.

3) 데이터보다 데이터에 더 많은 정보를 포함해야 할 때 사용됩니다 (정보에는 공간 현명한 관계, 통계 분포 등이 있습니다 ...). kriging을 사용하여 등방성 동작으로 많은 양의 데이터를 가지고 있다면 시간 낭비라는 것을 확신 할 수 있습니다. 적은 정보를 요구하여 실행 속도가 빠른 다른 방법을 사용하여 동일한 결과를 얻을 수 있습니다.


그리고 언제 다른 모델이 더 나은 선택입니까?
Ben

1
@Ben 항상 사례 연구에 의존합니다. Kriging 또는 Kriging 기반 방법은 계산 비용이 높으므로 빠르지는 않습니다. 예를 들어 최신 4k (또는 그 이상) TV는 보간법을 사용하여 더 작은 해상도를 위해 만들어진 콘텐츠를 시도하고 향상시킵니다. 이는 사용자 개입없이 (공분산 모델이 필요로하는)이 작업을 빠르게 수행해야 함을 의미합니다. 이 특정 문제를 해결하려면 Kriging을 완전히 피하십시오. 또한 일부 현상은 패턴 기반이거나 불연속 변수를 가지거나 공식 (예 : FEM) 등으로 감소 될 수 있습니다.
armatita

그리고 속도가 중요하지 않을 때?
Ben

결과가 즉각적 일 필요가없는 경우 @Ben Speed는 덜 중요합니다. GIS 과학의 서브 서피스 모델링, 날씨 예측 및 여러 작업이 그 예입니다. 다른 하나는 답에 제시된 것입니다 (지진 역전).
armatita

죄송합니다. 계산 속도와 결과 속도 모두 중요하지 않으며 GP의 단점은 무엇입니까? 또는 다른 말로하면 : 훨씬 더 자주 사용해서는 안 되는가?
Ben

7

엔지니어에게는 다음이 중요합니다.

  • 예측에 대한 신뢰 구간을 갖기 위해
  • 훈련 데이터 보간
  • 부드럽고 비선형 인 모델
  • 실험 및 최적화의 적응 형 설계를 위해 획득 한 회귀 모델 사용

가우스 프로세스는 이러한 모든 요구 사항을 충족합니다.

더욱이, 엔지니어링 및 지리 통계 데이터 세트는 그다지 크지 않거나 특정 그리드 구조를 가지고있어 빠른 추론이 가능합니다.


1
당신의 의견에 감사드립니다 . 베이 시안 해석으로 인해 가우시안 프로세스 모델은 불확실성 정량화가 양호하지만 파라 메트릭 회귀 분석에서도 가능합니다. 통계적 장점을 설명 할 수있는 기술적 접근법을 찾고 있습니다
Wis

3

가우스 모델의 장점.

가우시안 PDF는 1 차 및 2 차 모멘트에만 의존합니다. 넓고 고정 된 가우시안 프로세스는 또한 엄밀한 고정 프로세스이며, 그 반대도 마찬가지입니다.

가우시안 PDF는 중요한 클래스의 신호와 노이즈를 포함한 많은 프로세스의 분포를 모델링 할 수 있습니다. 많은 독립적 인 랜덤 프로세스의 합에는 가우스 분포 (중앙 한계 정리)가 있습니다.

비 가우시안 프로세스는 적절한 수단과 분산의 여러 가우시안 pdf의 가중치 조합 (즉, 혼합물)에 의해 근사화 될 수 있습니다.

가우스 모델을 기반으로 한 최적의 추정 방법은 종종 선형적이고 수학적으로 다루기 쉬운 솔루션을 만듭니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.