Zinkevich의 "온라인 볼록 최적화"( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf )는 선형 설정에서 볼록 설정까지 "후회 최소화"학습 알고리즘을 일반화하고 "외부 후회"를 제공합니다. . 내부 후회에 대해 비슷한 일반화가 있습니까? (나는 그것이 정확히 무엇을 의미하는지조차 확실하지 않습니다.)
질문에 내부 후회에 대한 간단한 설명을 추가 할 수 있습니까?
—
Moritz
일반적인 "전문가"설정에서 내부 후회는 회고에서 전체 역사에 걸쳐 한 행동을 다른 행동으로 바꾸고 싶지 않다는 것을 의미합니다. Blum-Mansour 논문은 아마도 내부 대 외부 후회에 대한 최상의 참조 일 것입니다 : jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
—
Noam