고차원 데이터 세트에 대한 가우스 프로세스 회귀


10

누구나 가우시안 프로세스 회귀 (GPR)를 고차원 데이터 세트에 적용한 경험이 있는지 알고 싶었습니다. 다양한 희소 GPR 방법 (예 : 희박 의사 입력 GPR) 중 일부를 조사하여 이상적 특성 선택이 매개 변수 선택 프로세스의 일부인 고차원 데이터 세트에 어떤 효과가 있는지 확인합니다.

시도 할 논문 / 코드 / 또는 다양한 방법에 대한 제안은 분명히 감사합니다.

감사.


2
언급 했듯이이 질문은 매우 모호합니다. 자급 자족하고 구체적이며 동기 부여가되는 질문은 여기서 가장 많은 관심과 최고의 답변을받는 경향이 있습니다. (당신이 해결하고자하는 특정 문제가 예를 들어, 독자가 당신이 뭘 하려는지 이해할 수있는 충분한 정보를 제공하는 것을 고려하라.)
추기경

답변:


13

가우시안 프로세스 모델은 일반적으로 고차원 데이터 세트에서 양호합니다 (마이크로 어레이 데이터 등에서 사용했습니다). 핵심은 하이퍼 파라미터에 적합한 값을 선택하는 것입니다 (정규화와 유사한 방식으로 모델의 복잡성을 효과적으로 제어합니다).

스파 스 방법과 의사 입력 방법은 많은 기능이 아니라 샘플 수가 많은 데이터 세트 (> 컴퓨터의 경우 약 4000)에 더 적합합니다. 공분산 행렬의 hole 레 스키 분해 (n by n, 여기서 n은 샘플 수)를 수행 할 수있는 강력한 컴퓨터가있는 경우 이러한 방법이 필요하지 않습니다.

MATLAB 사용자라면 GPML 도구 상자와 Rasmussen과 Williams 의 책 을 시작 하는 것이 좋습니다 .

그러나 기능 선택에 관심이 있다면 GP를 피할 수 있습니다. GP를 사용한 기능 선택에 대한 표준 접근 방식은 자동 관련성 결정 커널 (예 : GPML의 covSEard)을 사용한 다음 커널 매개 변수를 조정하여 한계 가능성을 최대화하여 기능 선택을 달성하는 것입니다. 불행히도 이것은 한계 가능성에 과도하게 적합하고 단순한 구형 방사형 기저 함수 (GPML의 covSEiso) 공분산을 가진 모델보다 성능이 더 나쁜 모델로 끝날 수 있습니다.

나의 현재 연구 초점은 현재 모델 선택의 과잉 적합에 중점을두고 있으며, 커널 모델에서 하이퍼 파라미터의 교차 검증 기반 최적화에 대한 것만 큼 GP의 증거 최대화에 있어서도 이것이 큰 문제라는 것을 알았습니다. 볼 이 종이 , 그리고 이 일을 .

비선형 모델의 피처 선택은 매우 까다 롭습니다. 선형 모델을 고수하고 L1 정규화 유형 접근 방식 (Lasso / LARS / Elastic net 등)을 사용하여 희소성 또는 임의의 포리스트 방법을 달성하면 성능이 향상되는 경우가 많습니다.


고마워 Dikran. 정규화 된 선형 모델을 위해 R에서 glmnet을 살펴 보았습니다. 불행히도 내 예측은 모두 동일합니다 (훈련 세트의 평균이라고 생각합니다). 선형 모델은 내 데이터에서 신호를 꺼내는 데 어려움을 겪고 있습니다. 그렇기 때문에 많은 기능 / 잠재적 기능 상호 작용을 처리 할 수있는 비선형 모델을 찾고있었습니다. 나는 그것이 많은 것을 요구하고 있다고 확신합니다. 그 제안에 대한 제안? P >> N 문제가 없습니다. 150 가지 기능, 1000 가지 예 사용
tomas

디크 란 그것은 내 의견에 그에 대해 미안하게 물었던 꽤 모호한 질문이었습니다. 나는 보드에 더 구체적인 질문을했다. 도와 주셔서 감사합니다. stats.stackexchange.com/questions/30411/…
tomas

문제가없는 경우가 종종 있습니다. 질문에 답하는 것이 질문에 대답하는 것보다 어렵습니다. 다른 질문들도 찾아 볼게요.
Dikran Marsupial

이 답변에 감사드립니다. 높은 차원의 특징이지만 너무 큰 데이터 세트 (n ~ 10k d ~ 1k)가 아닌 경우 ARD를 사용하여 계산 속도를 높일 수 있습니까? GPML 도구 상자를 사용하고 있습니다. 공분산 행렬을 자동으로 "분석"하여 관련 기능에 집중할 수 있습니까?
Emile

1
" r.csail.mit.edu/papers/v8/cawley07a.html "링크가 작동하지 않습니다 ...이 링크입니까? jmlr.org/papers/v8/cawley07a.html . 아마도 링크 대신 전체 인용을 추가하는 것이 도움이 될 것입니다 :-)
Curious

4

고차원 데이터를 처리하기 위해 특별히 설계된 공분산 함수를 사용할 수 있습니다. 예를 들어, 추가 공분산 함수에 대한 논문을 살펴보십시오 . 그것들은 다소 큰 입력 차원의 실제 데이터를 사용하여 수치 실험에서 다른 최신 공분산 함수보다 잘 작동했습니다 (약30).

그러나 입력 치수가 실제로 큰 경우 ( 100 또는 200) 커널 방법이 실패하고 가우시안 프로세스 회귀에 대한 배제는 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.