압축 감지에서는 에 고유 한 희소 솔루션 c 가 있음을 보장하는 정리 가 있습니다 (자세한 내용은 부록 참조).
올가미에 대한 비슷한 정리가 있습니까? 그러한 정리가 있다면 올가미의 안정성을 보장 할뿐만 아니라 올가미에보다 의미있는 해석을 제공합니다.
올가미 성긴 회귀 계수 벡터를 발견 할 수 응답 생성하기 위해 사용되는 하여 .
이 질문을하는 데는 두 가지 이유가 있습니다.
우리가 선택한 기능의 이점을 알 수 없기 때문에 'lasso는 희소 솔루션을 선호합니다'는 기능 선택에 올가미를 사용하는 이유에 대한 대답이 아니라고 생각합니다.
올가미가 기능 선택에 불안정한 것으로 유명하다는 것을 알았습니다. 실제로 안정성을 평가하려면 부트 스트랩 샘플을 실행해야합니다. 이 불안정성을 일으키는 가장 중요한 이유는 무엇입니까?
부록:
주어진 . A는 -sparse 벡터 ( )를. 프로세스 는 응답 y를 생성합니다 . 경우 순서의 NSP (null의 공간 속성)이 와의 공분산 행렬 제로에 어떤 고유 가까운이 없습니다에 유일한 해결책이 될 것입니다
이 정리에서 알 수 가 순서의 NSP가 아닌 경우 을 해결하는 것은 희망이 .
편집하다:
이 위대한 답변을받은 후, 나는이 질문을 할 때 혼란스러워한다는 것을 깨달았습니다.
이 질문이 혼란스러운 이유 :
디자인 매트릭스 몇 개의 피쳐 (열)가 있을지 결정해야하는 연구 논문 을 읽었습니다 (보조 피쳐는 기본 피쳐에서 생성됨). 전형적인 문제이므로 는 올가미 해가 실제 희소 해의 근사치가 될 수 있도록 잘 구성 될 것으로 예상됩니다.
추론은 부록에서 언급 한 정리에서 나옵니다 . sparse 솔루션 를 찾는 것을 목표로한다면 , 는 순서의 NSP를 갖는 것이 좋습니다 .
일반 행렬의 경우 을 위반하면
와 에서 를 안정적이고 강력하게 복구 할 수 없음
는 , 는 해당P y
... 관계 에서 예상되는 것처럼 설명 자의 선택이 더 불안정 해집니다. 즉, 다른 훈련 세트의 경우 선택한 설명자가 종종 다릅니다 ...
두 번째 인용문은 나를 혼란스럽게하는 부분입니다. 불평등이 위반되면 그것은 유일한 해결책 일뿐 만 아니라 언급되지 않았을 수도 있지만 (설명되지 않은) 설명자는 더 불안정해질 것입니다.