맥락 적 산적을위한 비용 함수


14

문맥 적 문제 를 해결하기 위해 vowpal Wabbit 을 사용 하고 있습니다 . 사용자에게 광고를 게재하고 있으며 광고가 게재되는 상황 (예 : 사용자가 누구인지, 어떤 사이트에 있는지 등)에 대한 정보가 상당히 있습니다. 이것은 John Langford에 의해 설명 된 것처럼 매우 고전적인 맥락 적 산적 문제인 것 같습니다 .

내 상황에서 사용자가 광고에 대해 가질 수있는 두 가지 주요 응답 : 클릭 (아마도 여러 번) 또는 클릭하지 않음 선택할 수있는 약 1,000 개의 광고가 있습니다. Vowpal Wabbit에는 action:cost:probability각 컨텍스트 형식의 대상 변수가 필요합니다 . 내 경우, action그리고 probability쉽게 알아낼 수 있습니다 것은 : action내가 디스플레이에 선택한 광고이며, probability광고를 게재에 대한 내 현재 정책 주어진 광고를 선택의 가능성이다.

그러나 지불액 (클릭 수)을 비용에 매핑하는 좋은 방법을 찾는 데 어려움을 겪고 있습니다. 클릭은 분명히 좋으며 같은 광고를 여러 번 클릭하는 것이 같은 광고를 한 번 클릭하는 것보다 낫습니다. 그러나 광고를 클릭하지 않는 것은 중립입니다. 실제로 클릭에 대한 기회를 놓친 것 이외의 비용은 들지 않습니다 (이상한 광고 환경에서 작업 중).

내가 가진 몇 가지 아이디어는 다음과 같습니다.

  1. 비용 = -1 * 부호 (클릭 수) + 0 * (클릭하지 않음)
  2. 비용 = -1 * 클릭 수 + 0 * (클릭하지 않음)
  3. 비용 = -1 * 부호 (클릭 수) + 0.01 * (클릭하지 않음)
  4. 비용 = -1 * 클릭 수 + 0.01 * (클릭하지 않음)

(0, 1, 5, 0)이 4 가지 기능의 비용 에 따른 행동 벡터의 경우 :

  1. (0, -1, -1, 0)
  2. (0, -1, -5, 0)
  3. (0.01, -1, -1, 0.01)
  4. (0.01, -1, -5, 0.01)

그것을 표현하는 다른 많은 방법들이 분명히 있으며 clicks=good, no clicks=bad.일반적으로 맹세의 보빗에서 상황 적 산적 문제에 대한 비용을 어떻게 모델링해야합니까? 혜택을 마이너스 비용으로 나타내는 것이 좋습니까, 아니면 모든 비용이 긍정적이되도록 모든 것을 재조정해야합니까? 상대적으로 중립적 인 행동이 비용이 전혀 들지 않는 것이 좋습니까, 아니면 긍정적 행동으로 모델을 밀어 붙이는 데 약간의 긍정적 인 비용을 주어야합니까?


1
"가능한 두 가지 조치가 있습니다. 사용자가 광고를 클릭하거나 광고를 클릭 할 수 없습니다." 게재 할 광고를 결정하려는 경우 광고가 액션이 아니어야합니까?
alto

1
@alto : "사용자에 대해 기록 할 수있는 두 가지 가능한 응답이 있습니다"라고 읽어야한다고 생각합니다. 더 이해가 되나요?
Zach

나는 이것이 당신의 목표가 무엇인지 확실하지 않기 때문에 이것이 실제로 상황에 맞는 산적 문제인지 확실하지 않습니다. 상황에 따른 산적 문제 해결 "관측 된 상황에 대해 최소 비용으로 조치를 선택하는 정책을 최적화하려고합니다." 얼마나 많은 광고를 게재하려고하십니까? 소비자 행동을 모델링하려고하십니까? 다른 것?
shadowtalker

1
@ssdecontrol 문맥에 따라 표시 할 광고를 파악하려고합니다. 그것은 문맥 적 도둑에게 일반적으로 사용되는 예제 문제이지만, vowpal-wabbit의 상황 적 도둑 솔버에서 정말 나쁜 결과를 얻고 있습니다. 광고의 클릭 또는 비 클릭에 '비용'을 지정해야하는 다른 방법이 있는지 궁금합니다.
Zach

1
@nik 나는 정말로 그것을 이해하지 못했고 대신 VW의 일반 멀티 클래스 모델을 사용했습니다.
Zach

답변:


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.