"먼저 스파 스"라는 용어는 (FBProphet Paper)를 의미합니까?


11

"예측 규모 예측"(FBProphet 예측 도구, https://peerj.com/preprints/3190.pdf 참조 )을 읽으면서 나는 "먼저 스파 스"라는 용어를 발견했습니다. 저자 는 로지스틱 성장 모델의 모델 매개 변수 인 스칼라 비율 에서 속도 편차 벡터를 모델링 할 때 이러한 "스파 스 이전"을 사용했다고 설명합니다 .δk

그들이 라고 말하면서, 매개 변수 가 작 으면 "sparse"가 0에 가까운 벡터를 가진 벡터를 가리키는 것을 올바르게 이해하고 있습니까? 모든 벡터 요소가 회귀의 매개 변수 일 필요가 있다고 생각했기 때문에 혼란 스럽지만 매개 변수 및 만 자유 모델 매개 변수로 남겨 두지 않습니까?δjLaplace(0,τ)τkτ

또한 Laplace 배포판을 사용하여 이전 공통점을 생성합니까? 예를 들어 정규 분포보다 선호하는 이유를 이해하지 못합니다.


1
나는 신문을 읽을 때이 질문에 대해 궁금합니다. 이 질문에 대한 답변을 찾았습니까? 또한 예언자 github 문제 섹션 에서이 질문을 했습니까? 저자 중 한 사람 (@bletham)은 질문에 대답하는 데 매우 적극적이며 그의 설명은 일반적으로 매우 좋습니다.
leaRner

답변:


4

희소 데이터 는 0이 많은 데이터입니다. 여기서 저자는 0을 선호하기 때문에 이전을 스파 스라고 부릅니다. 이것은 Laplace (일명 이중 지수) 분포의 모양을 볼 때 매우 자명합니다.

(이미지 출처 Tibshirani, 1996)

이 효과는 의 모든 값에 적용됩니다 (배포는 항상 위치 매개 변수, 여기서 0과 동일 함). 매개 변수 값이 작을수록 더 규칙적인 효과가 있습니다.τ

이러한 이유로 라플라스 사전은 종종 규칙적인 효과를 갖는 강력한 사전으로 사용됩니다 . 이 말을하자면, Laplace 사전은 대중적인 선택이지만 Van Erp et al (2019)에 설명 된 것처럼 실제로 스파 스 솔루션을 원한다면 더 나은 선택이있을 수 있습니다.

Van Erp, S., Oberski, DL, & Mulder, J. (2019). 베이지안 벌점 회귀에 대한 축소 우선 순위. 수학 심리학 저널, 89 , 31-50. 도 : 10.1016 / j.jmp.2018.12.004


3
+1 나는 이것들을 종종 "희소성 유발"이전이라고 부른다. 나는 개인적으로 더 분명하다고 생각하는 용어이다 (이전의 추정 회귀 계수에서 희소성을 유발한다)
Jake Westfall
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.