베이지안 스파이크 및 슬래브 대 벌점 법


11

BSTS R 패키지에 대한 Steven Scott의 슬라이드를 읽고 있습니다 (여기에서 찾을 수 있습니다 : 슬라이드 ).

어떤 시점에서, 구조 시계열 모델에 많은 회귀자를 포함하는 것에 대해 이야기 할 때 회귀 계수의 스파이크 및 슬래브 사전을 소개하고 처벌 된 방법에 비해 더 우수하다고 말합니다.

Scott은 100 개의 예측 변수가있는 데이터 세트의 예를 언급한다고 말합니다.

  • 불이익을받는 방법은 어떤 변수가 포함 / 제외되는지에 대한 단일 결정을 내 립니다. 즉, 가능한 변수 중 하나의 예측 변수 집합을 결정 합니다.2100
  • "올가미 (및 관련) 이전은 드문 드문 일이 아니며, 모드에서 희소성을 유발하지만 사후 분포에서는 그렇지 않습니다."

이 시점에서 그는 스파이크와 슬래브 사전을 소개합니다.

나는 직감을 가지고 있다고 생각하지만 그것에 대해 확신하고 싶습니다.

  • 기본적으로 포함 가능한 회귀 기의 각 하위 집합을 테스트 하는 무차별 대입 접근 방식을 사용한다는 점에서 더 낫 습니까?
  • 그렇게 할 때 계산 시간의 단점이 있습니까?
  • "올가미와 관련이 있지만 후부 배급에는 없다"고 말할 때 그가 무엇을 의미한다고 생각 하는가?

답변:


10

먼저 세 번째 질문에 대답하고 나중에 다른 두 가지를 다룰 것입니다.

  1. "올가미와 관련이 있지만 후부 배급에는 없다"고 말할 때 그가 무엇을 의미한다고 생각 하는가?

그의 슬라이드의이 그림은 그가 의미하는 바를 보여줍니다. 올가미 정규화기를 사전 배포로 표현한다는 것은 이전 배포가 라플라시안 또는 이중 지수 분포 의 형태를 취함을 의미합니다 . 이 분포는 평균에서 특성이 평활하지 않은 피크를 가지며, 희소 한 정규화 효과를 얻기 위해 0으로 설정됩니다. 올가미 정규화 결과를 직접 얻으려면 사후 분포 모드를 사용해야합니다.

테스트

그림에서 파란색 점선은 라플라시안 사전 분포를 나타냅니다. 진한 검정색의 사후 분포는 왼쪽에서 0에 약한 가능성으로 모드가 있고, 오른쪽에서 0에 가까우면서 강한 가능성이 있습니다.

그러나 전체 사후 분포는 드물지 않습니다. 표본을 추출하면 거의 0에 가까운 값을 얻을 수 없으며 실제로는 연속 분포이므로 정확하게 0을 얻지 못합니다.

올가미 접근 방식으로 희소성을 얻으려면 일반적으로 사후 모드에서 일부 차단 임계 값을 설정해야합니다. 이상적인 경우는 사후 모드가 0과 같지만 절대 값을 취한 후 사후 모드가 0.2보다 작 으면이를 완화하고 변수를 제거 할 수 있습니다.

올가미에서이 희소 화를 수행하면 제거 및 보유 된 특정 회귀 집합이 제공되는데, 이는 회귀자가 포함 또는 제외되는 "단일 결정"입니다.

변수 선택, 스파이크 및 슬래브에 대한 완전한 베이지안 접근법은 모델을 통해 어느 변수가 포함되거나 제외되어야하는지에 대한 불확실성을 유지합니다.

첫 번째 질문을 해결하려면 :

  1. 기본적으로 포함 가능한 회귀 기의 각 하위 집합을 테스트하는 무차별 대입 접근 방식을 사용한다는 점에서 더 나은가요?

어떤 방법도 포함 할 수있는 모든 회귀 분석을 테스트하지 않기 때문에 이것은 오해입니다.

  1. 그렇게 할 때 계산 시간의 단점이 있습니까?

계산 시간이 각각의 가능한 회귀 변수 서브 세트를 테스트하는 무차별 대입에 의해 지배되지 않기 때문에 이것은 또한 오해입니다.

Scott의 요점을 명확하게하기 위해, 일부 데이터를 감안할 때, 벌칙 적 가능성 가능성 희소 방식을 사용하면 정확히 한 세트의 포함 및 제외 회귀자를 얻을 수 있습니다. 그러나 스파이크 및 슬래브 희소 화 접근 방식을 사용하는 경우 각 회귀 자에 대해 전체 후방 분포가 있으며, 각 회귀 자에 대해 별도의 포함 또는 제외 가능성이 있습니다. 일부 회귀 분석기에는 70 %의 확률이 포함될 수 있고, 다른 회귀 분석기에는 25 %의 확률이 있습니다. 단일 데이터 세트가 주어지면 회귀자가 중요한지 여부에 대해 여전히 불확실성이 있기 때문에 이것은 많은 응용 분야에서 바람직 할 수 있습니다.

직관적으로, 스파이크와 슬래브는 올가미와 같은 처벌 가능성 접근법과 비교하여 포함 / 제외 회귀 기의 가능한 공간을 더 잘 나타냅니다.


2
대단히 감사합니다! Scott의 슬라이드에 대한 나의 이해는 너무 피상적이고 부분적으로 마크에서 벗어났습니다.
Tommaso Guerrini
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.