희소 솔루션을 생성하는 일반적인 방법은 분산이 알려지지 않은 평균 평균이 0 인 MAP 추정을 사용하는 것입니다.
p(xi|σ2i)∼N(0,σ2i)
그런 다음 모드가 0 인 이전을 지정하면 일반적으로 사후 모드가 성기 게됩니다. 지수 분포 혼합을 고려하여이 방법에서 발생한다.σ2iL1
p(σ2i|λ)∼Expo(λ22)
그럼 당신은 얻을
log[p(xi|λ)]=−λ|xi|+log[λ2]
일부 대안은 일반화 된 이중 파레토, 반 코시, 역 베타입니다. 어떤 의미에서는 이것들이 큰 값을 축소하지 않기 때문에 올가미보다 낫습니다. 사실 나는 일반화 된 이중 파레토가 지수의 혼합으로 쓰여질 수 있다고 확신합니다. 즉, 우리는 쓰고 앞에 감마를 배치합니다 . 우리는 얻는다 :λ=λip(λi|αβ)
p(xi|αβ)=α2β(1+|xi|β)−(α+1)
좋은 전역 매개 변수를 선택하는 데 도움이되는 정규화 상수를 포함했습니다. 이제 범위 제한을 적용하면 단면을 다시 정규화해야하므로 더 복잡한 문제가 발생합니다.
희소성을 유발하는 벌칙의 또 다른 일반적인 특징은 제로에서 차별화 할 수 없다는 것입니다. 일반적으로 왼쪽과 오른쪽 한계가 반대 부호이기 때문입니다.
이것은 Nicolas Polson과 James Scott의 분산 평균 혼합 표현에 대한 훌륭한 작업을 기반으로합니다 .TIRLS를 개발하는 데 사용됩니다. 최소 제곱을 매우 큰 클래스의 손실-페널티 조합으로 확장합니다.
다른 방법으로는 심플 렉스에 정의되어 있지만 한계 분포의 모드가 0 인 사전을 사용할 수 있습니다. 한 예는 0과 1 사이의 모든 모수를 갖는 디 리틀 렛 분포입니다. 묵시적 벌점은 다음과 같습니다.
−∑i=1n−1(ai−1)log(xi)−(an−1)log(1−∑i=1n−1xi)
여기서 입니다. 그러나 페널티에 특이점이 있기 때문에 수치 적으로 최적화하는 데주의를 기울여야합니다. 보다 강력한 추정 프로세스는 사후 평균을 사용하는 것입니다. 당신은 정확한 sparseness를 잃지 만, 제로에 가까운 많은 사후 수단을 얻을 것입니다 .p0<ai<1