올가미 회귀의 시간 복잡성은 무엇입니까?


답변:


4

올가미는 l1 정규화 가 적용된 선형 모델입니다 .

매개 변수 찾기는 제한없는 최적화 문제로 공식화 될 수 있습니다. 여기서 매개 변수는

argminβ||yXβ||2+α||β||1

제한적 포 뮬레이션에서 매개 변수는

argminβ||yXβ||2s.t.||β||1<α

이차 프로그래밍 문제이므로 다항식입니다.

신경망과 같은 유연한 비선형 물체의 경우에도 거의 모든 볼록 최적화 루틴은 대상 wrt 매개 변수의 미분을 계산합니다. 그래도 의 파생물을 취할 수는 없습니다 . 따라서 다른 기술에 의존합니다. 매개 변수를 찾는 방법에는 여러 가지가 있습니다. 다음 은 L1-Norm 정규화를 사용한 최소 제곱 최적화 주제에 대한 검토 보고서입니다 . 반복적 인 볼록 최적화의 시간 복잡성은 수렴 기준에 따라 달라지기 때문에 분석하기가 까다 롭습니다. 일반적으로 반복 문제는 관측치가 증가함에 따라 더 적은 에포크 (epoch)로 수렴됩니다.α||w||1


4
몇 가지 : 문제가 "다항식"이라고 말하는 것은 일종의 조합 문제 (보통 지수)를 보지 않는 한 특별히 도움이되지 않습니다. 둘째, 도함수 계산은 항상 제한 단계가 아닙니다 . 셋째, 일반적으로 반복 알고리즘의 시간 복잡도를 논의 할 때 일반적으로 단계 당 비용을 고려 하므로 수렴 기준에 의존 하지 않습니다 . 마지막으로, 더 많은 관측치 = 적은 반복 횟수는 일반적으로 그렇지 않습니다.
Cliff AB

13

@JacobMick은 더 광범위한 개요와 검토 논문에 대한 링크를 제공하지만 "바로 가기 답변"(특별한 경우로 간주 될 수 있음)을 제공하겠습니다.

후보 변수 (기능, 열)의 수를 로, 표본 크기 (관찰 수, 행)를 . LARS 알고리즘을 사용하여 구현 된 LASSO를 고려하십시오 ( Efron et al., 2004 ). LASSO의 계산 복잡도는 ( ibid. )n O ( K 3 + K 2 n )KnO(K3+K2n)

  • 들면 , 과 LASSO의 계산 복잡도는 으로 회귀와 동일하다, 변수 ( 에프론 외., 2004 , p. 443-444; 2005 년 Schmidt , 섹션 2.4 에서 인용 ; 회귀의 계산 복잡도에 대해서는 이 게시물을 참조하십시오 ).K 3 < K 2 n O ( K 2 n ) KK<nK3<K2nO(K2n)K
  • 들면 , 과 LASSO의 계산 복잡도는 ( 에프론 등., 2004 ).K 3K 2 n O ( K 3 )KnK3K2nO(K3)

참고 문헌 :


Richard, stats.stackexchange.com/questions/280304/… 에서 GLM 접근 방식의 반복 복잡성에 대해 언급 할 수 있습니까?
rnoodle

@ moodle, 나는 (지금은 시간이없는) 그것에 깊이 파고들 수는 없지만 질문에 +1합니다.
Richard Hardy

나는 보았지만 분명하지 않습니다. 두 번째 눈을 얻는 것이 좋습니다. 따라서 반복 복잡성과 완전한 수렴 복잡성이 있으며, 때로는 정의에 대한 문헌이 다소 모호하다고 생각합니다. 기본적으로 나는 알고리즘의 복잡도가 솔버에 크게 의존하도록 매우 중요한 위치에 올가미 솔버를 사용하는 알고리즘을 가지고 있습니다. 이것을 못 박는 것이 좋을 것입니다. 건배! 귀하의 의견을 반영하여 바운티를드립니다
rnoodle

@rnoodle, 나는 내가 당신을 곧 거기에서 도울 수있을 것이라고 의심하지만, 현상금은 확실히 더 잘 알고있는 다른 사람들을 끌어 들일 수 있습니다. 행운을 빕니다!
Richard Hardy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.