시변 바이어스로 바이어스 코인을 모델링하는 방법은 무엇입니까?


10

편향 동전 모델에는 일반적으로 하나의 매개 변수 있습니다. 일련의 추첨에서 를 추정하는 한 가지 방법 은 베타 사전을 사용하고 이항 우도를 갖는 사후 분포를 계산하는 것입니다.θ=P(Head|θ)θ

내 설정에서 이상한 물리적 프로세스로 인해 동전 속성이 천천히 변경되고 는 시간 의 함수가됩니다 . 내 데이터는 일련의 정렬 된 추첨입니다 (예 : . 나는 이산적이고 규칙적인 타임 그리드에서 각 에 대해 하나의 드로우를 가지고 있다고 생각할 수 있습니다 .θt{H,T,H,H,H,T,...}t

이것을 어떻게 모델링하겠습니까? 숨겨진 변수가 이고 이항 우도를 유지 한다는 사실에 적응 한 칼만 필터와 같은 것을 생각하고 있습니다. 추론을 다루기 쉽게하기 위해 를 모델링하는 데 무엇을 사용할 수 있습니까?θP(θ(t+1)|θ(t))

다음 답변 편집 (감사합니다!) : 를 HMM 또는 Kalman 필터에서 수행되는 것처럼 주문 1의 Markov Chain으로 모델링 하고 싶습니다. 내가 할 수있는 유일한 가정은 가 부드럽다는 것입니다. with with small Gaussian noise (Kalman filter idea) 라고 쓸 수 는 있지만 안에 있어야합니다 . @J Dav의 아이디어에 따라 probit 함수를 사용하여 실제 선을 에 매핑 할 수는 있지만 이것이 비 분석적 솔루션을 제공 할 것이라는 직관이 있습니다. 평균 의 베타 분포θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) 더 넓은 분산이 트릭을 수행 할 수 있습니다.

나는이 문제가 너무 단순하여 이전에 연구되어 왔어 야한다는 느낌을 가지고 있기 때문에이 질문을하고 있습니다.


성공 비율이 시간에 따라 어떻게 변하는 지에 대한 모형이 있다면 추정치를 얻을 수 있습니다. 많은 다른 모델이 작동하고 추정치는 가정 된 모델에 따라 많이 달라질 수 있습니다. 다루기 쉬움이 모델 선택의 실질적인 기준이라고 생각하지 않습니다. 프로세스를 이해하고 기대하는 동작에 동의하는 특성을 보여주는 모델을 찾고 싶습니다.
Michael R. Chernick

@MichaelChernick : 감사합니다. 내가 할 수있는 유일한 가정은 가 매끄럽고 천천히 움직이고 있다는 것입니다 . 더구나 다루기 쉬움은 중요하지 않은 상호 의존성을 가진 다변량 사례로 실제로 솔루션을 확장하고 싶기 때문에 중요한 기준입니다. 이상적인 솔루션은 분석적이며 새로운 데이터가 도착하면 매개 변수 추정값을 '온라인'으로 업데이트합니다. θ
repied2

1
" 가 매끄럽고 느리게 움직이고있다 " 는 말의 의미를 정량화 할 수 있습니까 ? 정수는 불 연속적이며 정수에 임의의 값을 취하는 부드러운 함수가 있습니다. 즉, 매끄러움은 제한이 없습니다. "느리게"어떤 개념은 여전히 ​​어떤 제약도주지 않지만 어떤 개념은 그렇지 않습니다. θ
Douglas Zare

0.1 / 단위 시간 또는 0.001의 확률 변화와 같이 "느리게"는 얼마나 빠릅니까? 그리고 얼마나 오래 시퀀스를 기대하십니까? 범위가 상대적으로 좁습니까 (예 : 0.2-0.4) 또는 (0,1)에 가까워 집니까?
jbowman

@DouglasZare '부드러움'으로, 나는 E [θ_t + 1 | θ_t] = θ_t (또는 매우 가깝게) VAR (θ_t + 1 | θ_t)가 작다고 말하고 싶었습니다. θ는 뛰어 내리지 않습니다 (그렇지 않으면 실제로 아무것도 할 수 없습니다).
repied2

답변:


2

분석 솔루션이있는 모델을 생각해 낼 수는 없지만 의심되는 모델의 종속성 구조가 간단하므로 올바른 도구를 사용하여 추론을 다루기 쉽습니다. 머신 러닝 연구원으로서, Expectation Propagation 기술을 사용하여 추론을 매우 효율적으로 만들 수 있기 때문에 다음 모델을 사용하는 것이 좋습니다.

를 시도 의 결과라고 하자 . 시변 파라미터를 정의하자X(t)t

η(t+1)N(η(t),τ2) 대해 .t0

와 를 연결하려면 잠재 변수를 도입하십시오η(t)X(t)

Y(t)N(η(t),β2) ,

모델 는X(t)

X(t)=1 이면 이고 , 그렇지 않으면 입니다. 실제로 무시할 수 단지 말하는 '들과 그들을 배척 (와 의 CDF 잠재 성 변수의 도입으로 추론이 쉬워집니다. 또한 원래 매개 변수화 유의하십시오 .Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

추론 알고리즘 구현에 관심 있는 경우이 백서를 살펴보십시오 . 그들은 매우 유사한 모델을 사용하므로 알고리즘을 쉽게 적용 할 수 있습니다. EP를 이해하려면 다음 페이지 가 유용 할 수 있습니다. 이 접근법을 추구하는 데 관심이 있다면 알려주십시오. 추론 알고리즘을 구현하는 방법에 대한 자세한 조언을 제공 할 수 있습니다.


0

내 의견을 자세히 설명하기 위해 p (t) = p exp (-t)와 같은 모델은 단순하고 최대 우도 추정을 사용하여 p 을 추정하여 p (t)를 추정 할 수있는 모델입니다 . 그러나 확률은 실제로 기하 급수적으로 붕괴합니다. 이 모델은 초기 및 이후에 관찰 한 것보다 높은 빈도로 성공한 기간을 관찰하면 분명히 잘못 될 것입니다. 진동 동작은 p (t) = p | sint | 로 모델링 할 수 있습니다 . 두 모델 모두 다루기 쉽고 최대 가능성으로 해결할 수 있지만 매우 다른 솔루션을 제공합니다.000


1
OP가 시간 , 에서 성공 확률을 모델링하려고하는 것으로 보입니다.t마코 비안 프로세스로 모델링하여 θ ( t )에 대한 일부 기능적 형태를 지정하지 않는 것으로 보인다. θ(t)θ(t)
매크로

1
@macro가 맞습니다 대한 매개 변수 양식을 제공 할 수 없으며이 기능이 부드럽기 때문에 바람직하지 않습니다. 숨겨진 Markov 모델 또는 Kalman 필터와 비슷한 차수 1의 Markov 모델을 원하지만 0과 1 사이의 실제 값을 사용하는 숨겨진 변수와 Bernouilli 우도를 갖는 숨겨진 변수가 있습니다. theta(t)
repied2

@pierre 편집하기 전에 시간 변화하는 p를 추정하고 HMM을 가능한 접근법으로 제안하고있는 것처럼 보입니다. 나는 t로 바뀌는 방식에 대한 기능적 형태를 권장하지 않았다. 추가 정보가 없으면 다양한 유형의 많은 모델을 구성 할 수 있으며 두 가지 예는 추가 정보없이 모델을 선택하면 매우 다른 답변을 줄 수 있음을 보여주었습니다. 왜 HMM을 고집 하시겠습니까? 하나가 효과가 있고 데이터에 적합하면 "비 분석적"이므로 거부하십시오.
Michael R. Chernick

편리한 솔루션을 찾는 것이 실제 통계 문제를 해결하는 방법이 아니라고 제안합니다!
Michael R. Chernick

1
@MichaelChernick 마지막으로 : 나는 이것이 잘 알려진 문제이고 사람들이 충분히 유연한 분석 솔루션을 제안했기 때문에 분석 솔루션을 찾고 싶습니다. 그러나 나는 '실제 역학'을 모델링하는 것이 일반적으로 계산 비용보다 중요하다는 제안에 동의합니다. 슬프게도 이것은 큰 데이터를위한 것이며 느린 algo는 쓸모가 없습니다 :-(
repied2

0

당신의 확률은 따라 변하지 만 Michael이 말했듯이, 당신은 방법을 모릅니다. 선형 또는 아닙니다? 확률 p : 모델 선택 문제처럼 보입니다 .tp

p=Φ(g(t,θ))g(t,θ)Φ

Φg()g()

재 편집 된 질문에 대답하려면 다음을 수행하십시오 .

당신이 말했듯이 probit을 사용하는 것은 수치 솔루션만을 의미하지만 대신 물류 기능을 사용할 수 있습니다

로지스틱 함수 : P[θ(t+1)]=11+exp(θ(t)+ϵ)

로 선형화 : logP1P=θ(t)+ϵ

θ(t+1)=at3+bt2+ct+dϵϵ

로짓 확률 : P[Coint+1=H|t]=11+exp(θ(t))

bernoulli 이벤트 (Markov Chain)에 이미 랜덤이 있으며 로 인해 소스를 추가하고 있습니다 . 따라서 문제를 t 를 설명 변수로 사용 하여 최대 우도에 의해 추정 된 Probit 또는 Logit으로 문제를 해결할 수 있습니다 . 나는 당신이 parsimony가 매우 중요하다는 데 동의한다고 가정합니다. 주된 목표가 주어진 방법 (HMM 및 Kalman Filter)을 적용하고 문제에 대한 가장 간단한 유효한 솔루션을 제공하지 않는 한입니다.ϵt


프로 비트를 사용하는 경우 다변량 프로 빗을 추정 할 수 있으므로 다변량 확장이 간단합니다. 묵시적 다변량 정규 분포의 공분산 행렬에 의해 종속성이 암시됩니다.
JDav
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.