(메모 편집 : 길이를 놀라게 한 후에 이것을 재구성했습니다.)
좌표 하강에 관한 문헌은 찾기가 조금 어려울 수 있습니다. 여기 몇 가지 이유가 있습니다.
좌표 방법의 알려진 많은 속성은보다 일반적인 하강 방법에 대한 우산 정리로 표현됩니다. 이 아래의 두 가지 예는, (임의의 보류중인 강한 볼록 빠른 수렴되어 최대 경사) 및 (일반적 Zoutendijk에 의한) 이러한 방법의 일반적인 수렴.lp
명명은 표준이 아닙니다. "가장 빠른 하강"이라는 용어조차 표준이 아닙니다. "사이클 좌표 하강", "좌표 하강", "Gauss-Seidel", "Gauss-Southwell"이라는 용어를 성공적으로 검색했을 수 있습니다. 사용이 일관되지 않습니다.
순환 변형은 특별한 언급을 거의받지 않습니다. 대신, 일반적으로 최상의 단일 좌표 선택 만 논의됩니다. 그러나 이것은 추가 인자 (변수 수) 이 있더라도 거의 항상 주기적 보증을 제공합니다 . 이는 대부분의 수렴 분석이 단일 단계의 개선을 하한으로 진행하기 때문에 추가 좌표를 무시할 수 있기 때문입니다. 또한 주기적이 당신을 사주는 것에 대해 일반적인 것을 말하기가 어려워서 사람들이 가장 잘 조정하고 n 인자를 확인할 수 있습니다.nn
강한 볼록한 상태에서 평가하십시오. 가장 간단한 경우는 목적 함수가 볼록한 것입니다. 여기서 모든 기울기 하강 변형은 비율을 갖습니다 . 이것은 Boyd & Vandenberghe의 책에서 입증되었습니다. 증명은 제 그래디언트 디센트에 대한 결과를 제공하고 일반적 대한 결과 수득 규범 당량 사용 L P의 가파른 하강한다.O(ln(1/ϵ))lp
제약 사항. 강한 볼록성이 없으면 약간 조심해야합니다. 제약 조건에 대해 아무 말도하지 않았으므로 일반적으로 부정한 것을 얻을 수 없습니다. 표준 접근 방식 (강하 방법 포함)이 타당성을 유지하기 위해 각 반복을 설정하거나 제한을 목표 함수에 롤링하기 위해 장벽을 사용하는 제약 조건에 대해 간략하게 설명하겠습니다. 전자의 경우, 나는 그것이 좌표 하강에서 어떻게 작동하는지 모른다. 후자의 경우 좌표 하강으로 잘 작동 하며이 장벽은 강하게 볼록 할 수 있습니다.
보다 구체적으로, 투영보다는 방법을 조정하기 위해 많은 사람들이 단순히 좌표 업데이트를 실현 가능성으로 유지합니다. 예를 들어 Frank-Wolfe 알고리즘과 그 변형 (예 : SDP를 해결하는 데 사용)과 정확히 일치합니다.
또한 SVM에 대한 SMO 알고리즘은 두 개의 변수를 한 번에 업데이트하고 타당성 제약 조건을 유지하는 좌표 하강 방법으로 볼 수 있습니다. 변수의 선택은이 방법에서 휴리스틱하므로 보증은 실제로 순환 보증입니다. 이 연결이 표준 문헌에 나타나는지 확실하지 않습니다. Andrew Ng의 강의 노트에서 SMO 방법에 대해 배웠고 매우 깨끗하다는 것을 알았습니다.
일반적인 수렴 보장. 이보다 일반적인 설정 (좌표 하강)에서 내가 아는 것은 훨씬 약합니다. 첫째, Zoutendijk에 따르면 이러한 모든 그라디언트 변형이 수렴을 보장한다는 고대 결과가 있습니다. 이 책은 Nocedal & Wright의 저서에서 찾을 수 있으며 Bertsekas의 저서 중 일부에도 나타납니다 (최소한 "비선형 프로그래밍"에 있음). 이 결과는 다시 좌표 하강보다 더 일반적인 것에 대한 것이지만 하강을 조정하도록 특수화 한 다음 을 곱하여 순환 부분을 얻을 수 있습니다.n
O(ln(1/ϵ))
좌표 하강에 대한 최근 결과가 더 있습니다. arXiv에서 물건을 보았습니다. 또한 luo & tseng에는 최신 논문이 있습니다. 그러나 이것은 주요한 것입니다.
∑mi=1g(⟨ai,λ⟩)g(ai)m1λexp(1/ϵ2)O(1/ϵ)
정확한 업데이트 문제. 또한 닫힌 단일 좌표 업데이트가없는 경우가 종종 있습니다. 또는 정확한 해결책이 존재하지 않을 수 있습니다. 그러나 운 좋게도 정확한 솔루션과 기본적으로 동일한 보장을받는 수많은 라인 검색 방법이 있습니다. 이 자료는 표준 비선형 프로그래밍 텍스트, 예를 들어 위에서 언급 한 Bertsekas 또는 Nocedal & Wright 서적에서 찾을 수 있습니다.
두 번째 단락은 다음과 같습니다.
첫째, 좌표 하강에 대한 기울기 작업에 대해 위에서 언급 한 많은 분석이 있습니다. 왜 항상 좌표 하강을 사용하지 않습니까? 그에 대한 해답은 경사 하강이 적용 가능한 많은 문제에 대해 뛰어난 수렴이 입증 될 수있는 뉴턴 방법을 사용할 수도 있다는 것입니다. 좌표 하강으로 뉴턴의 이점을 얻는 방법을 모르겠습니다. 또한 Quasinewton 업데이트를 통해 높은 비용의 Newton 분석법을 완화 할 수 있습니다 (예 : LBFGS 참조).
엘0케이케이케이케이f