온라인 볼록 최적화의 내부 후회

19

Zinkevich의 "온라인 볼록 최적화"( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf )는 선형 설정에서 볼록 설정까지 "후회 최소화"학습 알고리즘을 일반화하고 "외부 후회"를 제공합니다. . 내부 후회에 대해 비슷한 일반화가 있습니까? (나는 그것이 정확히 무엇을 의미하는지조차 확실하지 않습니다.)

lg.learning online-learning

— 노암
소스

질문에 내부 후회에 대한 간단한 설명을 추가 할 수 있습니까?

— Moritz

일반적인 "전문가"설정에서 내부 후회는 회고에서 전체 역사에 걸쳐 한 행동을 다른 행동으로 바꾸고 싶지 않다는 것을 의미합니다. Blum-Mansour 논문은 아마도 내부 대 외부 후회에 대한 최상의 참조 일 것입니다 : jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf

— Noam

9

Gordon, Greenwald 및 Marks의 http://portal.acm.org/citation.cfm?id=1390202의 "볼록 게임에서 후회없는 학습"을 시도 하십시오 . 초록은 아마도 귀하의 질문에 대답하는 것처럼 들리거나 적어도 그 질문에 대답하는 사람은 그 논문에 인용되거나 인용 될 것입니다.

— 워렌 슈디
소스

0

이 Avrim Blum 용지 는 외부 및 내부 후회 사이의 연결을 나타냅니다. 요약에 따르면, 외계인 후회는 알고리즘이 최상의 고정 동작과 얼마나 나쁜지를 측정하는 반면 내부 후회는 해당 방법의 최상의 변형과 비교합니다 (원래 알고리즘이보고 될 때마다 클래스 A를보고하는 것처럼 출력의 최상의 고정 순열) 클래스 B).

— 알렉산드르 파 소스
소스

1

Blum-Mansour 용지는 "온라인 볼록 최적화"설정이 아니라 선형 "전문가"설정에 있습니다. 내 질문은 비슷한 또는 다른 직접적인 내부 후회 알고리즘을 볼록한 설정에 적용 할 수 있는지 여부입니다.

— Noam