를 x , y ∈ { 1 , … , K } 와 함께 두 개의 범주 형 변수 X , Y 의 공동 분포라고 합시다 . 이 분포에서 n 개의 표본을 추출 했다고 가정 하지만 j = 1 , … , K에 대한 한계 계수 만 제공됩니다 .
최대 우도 추정이란 , 주어진 S의 J , T의 J는 ? 이것이 알려져 있습니까? 계산 가능합니까? ML 외에이 문제에 대한 다른 합리적인 접근 방법이 있습니까?
를 x , y ∈ { 1 , … , K } 와 함께 두 개의 범주 형 변수 X , Y 의 공동 분포라고 합시다 . 이 분포에서 n 개의 표본을 추출 했다고 가정 하지만 j = 1 , … , K에 대한 한계 계수 만 제공됩니다 .
최대 우도 추정이란 , 주어진 S의 J , T의 J는 ? 이것이 알려져 있습니까? 계산 가능합니까? ML 외에이 문제에 대한 다른 합리적인 접근 방법이 있습니까?
답변:
이러한 종류의 문제는 Dobra et al (2006) 의 논문 "고정 한계 총계 를 갖는 다 방향 우연성 테이블의 데이터 증강" 에서 연구되었다 . 하자 모델의 파라미터를 나타낸다하게 해당 각 계수의 관측 정수 테이블을 나타내는 ( X , Y ) 쌍과하자 C ( S , T ) 한계 카운트 동일 정수 테이블들의 집합 ( S , T ) . 그런 다음 한계 카운트 ( S , T ) 를 관찰 할 확률은 다음과 같습니다. p ( 여기서 p ( n | θ ) 는 다항식 샘플링 분포입니다. 이는 ML에 대한 우도 함수를 정의하지만 작은 문제를 제외하고 직접 평가는 불가능합니다. 그들이 권장하는 접근 방식은 MCMC이며 n 과 θ 를 번갈아 업데이트합니다.
다른 접근법은 변형 방법을 사용하여 대한 합계를 근사화합니다 . 한계 제약은 인자 그래프로 인코딩 될 수 있고 θ에 대한 추론은 기대 전파를 사용하여 수행 될 수있다.
이 문제가 어려운 이유와 사소한 해결책을 인정하지 않는 이유를 보려면 . 촬영 S를 로우 합과 같은 T 열의 합으로서 카운트 테이블의 두 가지가있다 : [ 0 1 2 0 ] 따라서, 우도 함수이며 , p는(S,T | θ)=3 , P (12) , P 2 (21) +(6) P 11 (P) (21) , P (22) 이 문제에 대한 MLE 인 (P)의 X , Y = [ 0 1 / 3 2 / 3 0 ]
@Glen_b가 지적했듯이 이것은 충분하지 않습니다. 가능성을 완전히 지정할 수 없다면 최대 가능성을 사용할 수 있다고 생각하지 않습니다.
독립성을 기꺼이 생각한다면 문제는 매우 간단합니다 (실수로, 해결책은 제안 된 최대 엔트로피 솔루션이라고 생각합니다). 문제에 추가 구조를 기꺼이 적용하지 않고 여전히 세포 값에 대한 근사치를 원한다면 Fréchet-Hoeffding copula bounds를 사용할 수 있습니다 . 추가 가정이 없으면 더 이상 갈 수 없다고 생각합니다.
maximum-entropy
태그 를 사용 했 습니까? 최대 엔트로피 솔루션을 사용하고 있습니까?