온라인 볼록 최적화의 내부 후회


19

Zinkevich의 "온라인 볼록 최적화"( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf )는 선형 설정에서 볼록 설정까지 "후회 최소화"학습 알고리즘을 일반화하고 "외부 후회"를 제공합니다. . 내부 후회에 대해 비슷한 일반화가 있습니까? (나는 그것이 정확히 무엇을 의미하는지조차 확실하지 않습니다.)


질문에 내부 후회에 대한 간단한 설명을 추가 할 수 있습니까?
Moritz

일반적인 "전문가"설정에서 내부 후회는 회고에서 전체 역사에 걸쳐 한 행동을 다른 행동으로 바꾸고 싶지 않다는 것을 의미합니다. Blum-Mansour 논문은 아마도 내부 대 외부 후회에 대한 최상의 참조 일 것입니다 : jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
Noam

답변:



0

이 Avrim Blum 용지 는 외부 및 내부 후회 사이의 연결을 나타냅니다. 요약에 따르면, 외계인 후회는 알고리즘이 최상의 고정 동작과 얼마나 나쁜지를 측정하는 반면 내부 후회는 해당 방법의 최상의 변형과 비교합니다 (원래 알고리즘이보고 될 때마다 클래스 A를보고하는 것처럼 출력의 최상의 고정 순열) 클래스 B).


1
Blum-Mansour 용지는 "온라인 볼록 최적화"설정이 아니라 선형 "전문가"설정에 있습니다. 내 질문은 비슷한 또는 다른 직접적인 내부 후회 알고리즘을 볼록한 설정에 적용 할 수 있는지 여부입니다.
Noam
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.