PTLOS 운동 4.1을 해결 한 사람이 있습니까?


19

이것은 확률 이론 : Edwin Jaynes 의 과학의 논리 , 2003 년에 주어진 연습 입니다. 여기에 부분적인 해결책이 있습니다 . 더 일반적인 부분 솔루션을 개발했으며 다른 사람이 해결했는지 궁금합니다. 내 답변을 게시하기 전에 잠시 기다렸다가 다른 사람들에게 도움을 줄 것입니다.

자, 우리가 표시된 상호 배타적이고 철저한 가설 이 있다고 가정하십시오 . 또한 표시되는 데이터 세트 가 있다고 가정하십시오 . i 번째 가설의 우도 비율은 다음과 같습니다.N nH의 ( i = 1 , , n ) Hi(i=1,,n)m mD j( j = 1 , , m )Dj(j=1,,m)

L R ( H i ) = P ( D 1 D 2, D m | H i )P ( D 1 D 2, D m | ¯ H i )

LR(Hi)=P(D1D2,Dm|Hi)P(D1D2,Dm|H¯¯¯¯¯i)

이것들은 조건부 확률입니다. 이제 주어진 i 번째 가설 가정 m 우리는 그래서 데이터 세트, 독립적 :H IHi mm

P ( D 1 D 2, D m | H i ) = m j = 1 P ( D j | H i )( i = 1 , , n )조건 1

P(D1D2,Dm|Hi)=j=1mP(Dj|Hi)(i=1,,n)Condition 1

이제 분모 가이 상황에서도 고려해 보면 매우 편리합니다.

P ( D 1 D 2, D m | ¯ H i ) = m j = 1 P ( D j | ¯ H i )( i = 1 , , n )조건 2

P(D1D2,Dm|H¯¯¯¯¯i)=j=1mP(Dj|H¯¯¯¯¯i)(i=1,,n)Condition 2

이 경우 우도 비율은 각 데이터 세트에 대해 더 작은 요소의 곱으로 분할되므로 다음과 같이됩니다.

L R ( H i ) = m j = 1 P ( D j | H i )P ( D j | ¯ H i )

LR(Hi)=j=1mP(Dj|Hi)P(Dj|H¯¯¯¯¯i)

그래서이 경우, 각 데이터 세트 것 "에 대한 투표 H의 Hi "또는 "에 대한 투표 H의 Hi "독립적으로 다른 데이터 세트의.

n > 2n>2 ( 2 개의 가설 이상) 인 경우이 인수 분해가 발생할 수있는 사소한 방법이 없음 을 증명해야 합니다. 즉, 조건 1과 조건 2가 유지된다고 가정하면 P ( D 1 | H i )P ( D 1 | ¯ H i ) P(D 2 |H i )P ( D 2 | ¯ H i )P(D m |H i )P ( D m | ¯ H i )

P(D1|Hi)P(D1|H¯¯¯¯¯i)P(D2|Hi)P(D2|H¯¯¯¯¯i)P(Dm|Hi)P(Dm|H¯¯¯¯¯i)
은 (는 ) 1과 다르므로 하나의 데이터 집합 만 가능성 비율에 기여합니다.

개인적으로이 결과는 여러 가지 가설 검정이 일련의 이진 가설 검정에 불과하다는 것을 보여주기 때문에 매우 흥미로 웠습니다.


의 색인에 약간 혼란 스럽습니다 . 이다 ? 아니면 입니까? 그것이 후자 인 것처럼 보이지만 첨자가 왜 그런지 잘 모르겠습니다. 아니면 어쩌면 나는 완전히 다른 것을 놓치고 있습니다 :)ˉ H iH¯i ˉ H i=argmaxhHiP(D1,Dm|h)H¯i=argmaxhHiP(D1,Dm|h) ˉ H i=argmaxh{H1,,Hn}P(D1,Dm|h)H¯i=argmaxh{H1,,Hn}P(D1,Dm|h)
JMS

@JMS- 는 논리 문 " 이 거짓"이거나 다른 가설 중 하나가 참이라는 것을 나타냅니다. 따라서 "부울 대수"에는 (가설 때문에) 독점적이고 철저한)¯ H iHi ¯ H iH1+H2++Hi1+Hi+1++HnH¯¯¯¯¯iHiH¯¯¯¯¯iH1+H2++Hi1+Hi+1++Hn
확률 론적

샌더스의 부분 솔루션에 주어진 대수보다 더 직관적 인 솔루션이 있어야한다고 생각합니다. 각 가설에 대해 데이터가 독립적 인 경우 가설의 우선 순위가 달라질 때 계속 유지됩니다. 그리고 어떻게 든 결론은 같은 결론을 적용해야한다는 것입니다.
charles.y.zheng

@ 찰스-나는 당신이 어떻게 느끼는지 정확히 알고 있습니다. 질적 불일치 (Reductio ad absurdum)를 사용하여 파생시킬 수 있다고 생각했지만 그렇게 할 수 없었습니다. 그래도 샌더의 수학을 확장 할 수있었습니다. 그리고 결과가 의미하는 바는 "피상적 인 것"인 조건 2입니다.
chanceislogic

@probabilityislogic "여러 가설 검정은 일련의 이진 가설 검정에 불과하다는 것을 기본적으로 보여줍니다." 이 문장을 넓힐 수 있습니까? Jaynes의 책에서 98 페이지를 읽음으로써 테스트 를 서로 다른 가설에 대해 을 테스트 하는 것으로 줄인 다음 의 후부를 얻기 위해 어떻게 든 정규화 할 수 있음을 이해합니다. 운동 결과 4.1. H 1 , , H n H 1 H 1H1,,HnH1H1
Martin Drozdik 2016 년

답변:


7

우리가 eq.를 수락 한 이유 4.28 (도서에서 조건 1)은 특정 가설 와 배경 정보 가 주어진 데이터의 확률 이 독립적 했습니다. , 및 과 같습니다.H a X D i D j i jHaXDiDjij

P(Di|DjHaX)=P(Di|HaX)(1)

P(Di|DjHaX)=P(Di|HaX)(1)
그러므로 이항 경우를 넘어서는 확장 성은 다음과 같이 논의 될 수 있습니다. .1이 사실이라면, eq.2도 참입니까?

P(Di|Dj¯HaX)?=P(Di|¯HaX)(2)

P(Di|DjHa¯¯¯¯¯¯X)=?P(Di|Ha¯¯¯¯¯¯X)(2)
먼저 곱셈 규칙을 사용하여 등식 2의 왼쪽을 살펴 보겠습니다.

P(Di|Dj¯HaX)=P(DiDj¯Ha|X)P(Dj¯Ha|X)(3)

P(Di|DjHa¯¯¯¯¯¯X)=P(DiDjHa¯¯¯¯¯¯|X)P(DjHa¯¯¯¯¯¯|X)(3)
때문에 가설 상호 배타적이고 철저한 가정, 우리는 쓸 수있다 : 따라서 식 3은 다음과 같이됩니다. (1 개만 존재하기 때문에 우리는 단지 두 가지 가설을 가지고있는 경우에있어서, 합산 제거한 , 추천인 및 분모에서 동등한 조건) ), 취소 및 등식 2가 올바른 것으로 판명되었습니다.nn{H1Hn}{H1Hn}¯Ha=baHb
Ha¯¯¯¯¯¯=baHb
P(Di|Dj¯HaX)=baP(Di|DjHbX)P(DjHb|X)baP(DjHb|X)=baP(Di|HbX)P(DjHb|X)baP(DjHb|X)
P(Di|DjHa¯¯¯¯¯¯X)=baP(Di|DjHbX)P(DjHb|X)baP(DjHb|X)=baP(Di|HbX)P(DjHb|X)baP(DjHb|X)
babaP(DjHb|XP(DjHb|XHb=¯HaHb=Ha¯¯¯¯¯¯ . 따라서 방정식 4.29는이 책의 방정식 4.28에서 파생 될 수 있습니다. 그러나 가설이 두 개 이상인 경우에는 이러한 현상이 발생하지 않습니다. 예를 들어 가설이 세 개인 경우 위의 방정식은 다음과 같습니다. 다시 말해 : 이 방정식이 eq.2를 산출 할 수있는 유일한 방법은 두 분모가 모두 1과 같다는 것입니다. 분모는 0과 같아야합니다. 그러나 그것은 불가능합니다.{H1,H2,H3}{H1,H2,H3}P(Di|Dj¯H1X)=P(Di|H2X)P(DjH2|X)+P(Di|H3X)P(DjH3|X)P(DjH2|X)+P(DjH3|X)
P(Di|DjH1¯¯¯¯¯¯X)=P(Di|H2X)P(DjH2|X)+P(Di|H3X)P(DjH3|X)P(DjH2|X)+P(DjH3|X)
P(Di|Dj¯H1X)=P(Di|H2X)1+P(DjH3|X)P(DjH2|X)+P(Di|H3X)1+P(DjH2|X)P(DjH3|X)
P(Di|DjH1¯¯¯¯¯¯X)=P(Di|H2X)1+P(DjH3|X)P(DjH2|X)+P(Di|H3X)1+P(DjH2|X)P(DjH3|X)

1
네 번째 방정식이 잘못되었다고 생각합니다. 우리는이 있어야P(DiDjHb|X)=P(DiHB|X)P(Dj|HbX)P(DiDjHb|X)=P(DiHB|X)P(Dj|HbX)
probabilityislogic

매우 확률 론적으로 감사합니다, 나는 해결책을 고칠 수있었습니다. 지금 어떻게 생각하세요?
astroboy

나는 Jaynes의 말을 이해하지 못한다. "논리적 독립성과 인과 적 독립을 구별하지 못하는 사람들은 (4.29)가 항상 유효하다고 가정 할 것이다."
astroboy

Jaynes 위의 문장이 말한 직후 : " 가 다른 에 물리적 영향을 미치지 않는 경우에만 제공했습니다 ." 따라서 Jaynes는 본질적으로 물리적 영향이 없더라도 일반화를 두 가지 이상의 가설로 허용하지 않는 논리적 제한이 있다고 말합니다. DiDiDjDj
astroboy

본문을 다시 읽은 후 마지막 의견이 좋은 답변이 아니라고 생각합니다. 내가 지금 이해하고 있듯이 Jayne은 "논리적 독립성과 인과 적 독립을 구별하지 못하는 사람들"은 와 가 물리적 영향을 미치지 않는다고 주장 할 것이라고 말했다 . 따라서 그것들은 인과의 독립성을 가지므로 어떤 가설들에 대해서도 논리적 독립성을 의미한다. 그래서 그들은이 모든 논의가 의미가 없음을 발견하고 단순히 이진 사례를 일반화합니다. DiDiDjDj
astroboy 2016 년

1

좋아, 그래서 손더스의 방정식 (5)를 다시 도출하기보다는 여기에 언급하겠습니다. 조건 1과 2는 다음과 같은 평등을 의미합니다.

mj=1(kihkdjk)=(kihk)m1(kihkmj=1djk)

j=1m(kihkdjk)=(kihk)m1(kihkj=1mdjk)
여기서 djk=P(Dj|Hk,I)hk=P(Hk|I)
djk=P(Dj|Hk,I)hk=P(Hk|I)

이제 우리는 을 취하고 레이블을 다시 지정 하여 (2 개의 데이터 세트)로 전문화 할 수 있습니다. . 이 두 데이터 세트는 여전히 조건 1과 2를 만족하므로 위의 결과도 적용됩니다. 이제 경우 확장 하면 다음과 같습니다.m=2m=2D(1)1D1D(1)1D1D(1)2D2D3DmD(1)2D2D3Dmm=2m=2

(kihkd1k)(lihld2l)=(kihk)(lihld1ld2l)

(kihkd1k)(lihld2l)=(kihk)(lihld1ld2l)

kilihkhld1kd2l=kilihkhld1ld2l

kilihkhld1kd2l=kilihkhld1ld2l

kilihkhld2l(d1kd1l)=0(i=1,,n)

kilihkhld2l(d1kd1l)=0(i=1,,n)

용어 는 및 일 때 한 번, 및 때 다시 한 번 위의 이중 합계에서 두 번 발생 . 이것은 발생합니다 . 각 항의 계수는 및 됩니다. 이제이 방정식 중 가 있으므로 실제로이 방정식에서 를 제거 할 수 있습니다 . 설명하기 위해 취 하면 이제 및 제외한 모든 조건이 있음을 의미 합니다. 이제 취하십시오(d1ad1b)(d1ad1b)k=ak=al=bl=bk=bk=bl=al=aa,bia,bid2bd2bd2ad2aiiiii=1i=1a=1,b=2a=1,b=2b=1,a=2b=1,a=2i=3i=3우리는 이제이 두 가지 조건을 가질 수 있습니다 (이것은 적어도 세 가지 가정을 가정합니다). 따라서 방정식을 다음과 같이 다시 작성할 수 있습니다.

l>khkhl(d2ld2k)(d1kd1l)=0

l>khkhl(d2ld2k)(d1kd1l)=0

이제 각 항은 0보다 커야합니다. 그렇지 않으면 우리는 가설을 다루기 때문에 대답은 관점에서 재구성 될 수 있습니다 . 따라서 위의 조건에서 제거 할 수 있습니다.hihin1<nn1<nn1n1

l>k(d2ld2k)(d1kd1l)=0

l>k(d2ld2k)(d1kd1l)=0

따라서, 거기 그 : 만족되어야하는 조건으로, 각 상태는 두 개의 "서브 상태"중 하나를 의미 중 하나에 대한 또는 (둘다는 아님). 이제 대한 모든 고유 쌍 세트가 있습니다 . 우리가 걸릴 것 인 경우 의 하나 이러한 쌍을 , 우리는 모든 숫자 것 세트에, 그리고 . 첫 번째 쌍에는 요소가 있고 각 추가 쌍은 하나 이상의 추가 요소를 세트에 가져 오기 때문입니다 *n(n1)2n(n1)2djk=djldjk=djlj=1j=1j=2j=2(k,l)(k,l)djk=djldjk=djln1n1jj1,,n1,,ndj1=dj2==dj,n1=dj,ndj1=dj2==dj,n1=dj,n22

그러나 조건이 있으므로 적어도 보다 크거나 같은 가장 작은 정수를 선택해야합니다. 또는 중 하나에 대해 입니다 . 경우 다음 선택 조건의 수가보다 큰 . 만약 또는 우리가 선택해야 정확히 용어. 이는 입니다. 두 가설 ( ) 만있는 경우 이것이 발생하지 않습니다. 그러나 Saunder의 기사의 마지막 방정식에서이 평등 조건은 다음을 의미합니다.n(n1)2n(n1)212×n(n1)2=n(n1)412×n(n1)2=n(n1)4j=1j=1j=2j=2n>4n>4n1n1n=4n=4n=3n=3n1n1dj1=dj2==dj,n1=dj,ndj1=dj2==dj,n1=dj,nn=2n=2

P(Dj|¯Hi)=kidjkhkkihk=djikihkkihk=dji=P(Dj|Hi)

P(Dj|H¯¯¯¯¯i)=kidjkhkkihk=djikihkkihk=dji=P(Dj|Hi)

따라서 우도 비에는 P(D(1)1|Hi)P(D(1)1|¯Hi)=P(D1|Hi)P(D1|¯Hi)=1 ORP(D(1)2|Hi)P(D(1)2|¯Hi)=P(D2D3,Dm|Hi)P(D2D3,Dm|¯Hi)=1

P(D(1)1|Hi)P(D(1)1|H¯¯¯¯¯i)=P(D1|Hi)P(D1|H¯¯¯¯¯i)=1 ORP(D(1)2|Hi)P(D(1)2|H¯¯¯¯¯i)=P(D2D3,Dm|Hi)P(D2D3,Dm|H¯¯¯¯¯i)=1

증명을 완료하기 위해 두 번째 조건이 유지되면 결과가 이미 입증되었으며 하나의 비율 만 1과 다를 수 있습니다. 첫 번째 조건이 유지되면 및 . 그러면 이 기여하지 않거나 가 유일한 기여자가됩니다. 그런 다음 가) 보류에 기여하지 않는 경우 세 번째 레이블을 다시 지정 합니다. 따라서 조건 1과 조건 2가 유지 될 때 하나의 데이터 세트 만 우도 비율에 기여할 수 있으며 두 개 이상의 가설이 있습니다.D(2)1D2D(2)1D2D(2)2D3,DmD(2)2D3,DmD1,D2D1,D2D2D2D1D2D1D2

* 참고 : 추가 쌍은 새로운 용어를 가져올 수 없지만이 용어는 2 개의 새로운 용어를 가져온 것으로 상쇄됩니다. 예를 들어 를 첫 번째로 사용 [+2], [+1] 및 [+0] 대해 가 있습니다 . 두 개의 용어 [+2]가 추가됩니다. 만약 우리는 더 이상 선택할 필요가 없습니다, 그러나 "다른"에 대한 우리가하지 않는 3쌍 선택해야합니다 . 이것들은 이므로 모든 숫자 가 세트에 있기 때문에 등식이 유지 됩니다.dj1=dj2dj1=dj2dj1=dj3dj2=dj3djk=djlk,l(1,2,3)n=4j(1,2),(2,3),(1,3)(1,4),(2,4),(3,4)(1,2,3,4)


이 증명의 정확성을 의심하기 시작했습니다. Saunders 수학의 결과 는 에 대해 비선형 제약 조건 만 암시합니다 . 이것은 가 대신 자유도 만 갖도록 합니다. 그러나 조건 에 도달하려면 다른 인수가 필요합니다. ndjkdjkn2nn(n1)2
확률

0

기록을 위해 여기에 좀 더 광범위한 증거가 있습니다. 배경 정보도 포함되어 있습니다. 아마도 이것은 주제를 연구하는 다른 사람들에게 도움이 될 것입니다.

증거의 주요 아이디어는 Jaynes의 조건 1과 2가 하나의 데이터 세트를 제외한 모든 데이터 세트에 대해 임을 암시한다는 것 입니다. . 그런 다음 모든 데이터 세트에 대해 따라서 우리는 하나의 데이터 세트를 제외하고 모두 여기에 증거를 포함 이유는 관련된 단계 중 일부가 명확하지 않으며 조건 이외의 다른 것을 사용하지 않도록주의해야한다는 것입니다. 1 및 2와 제품 규칙 (다른 많은 증거가 암시 적으로 수행함). 링크P(Dmk|HiX)=P(Dmk|X),

mk=1,,mP(Dmk|¯HiX)=P(Dmk|X).
P(Dmk|HiX)P(Dmk|¯HiX)=P(Dmk|X)P(Dmk|X)=1.
이 모든 단계를 자세히 포함합니다. Google 드라이브에 있으며 액세스 가능한 상태로 유지합니다.


Cross Validated에 오신 것을 환영 합니다 . 답변 주셔서 감사합니다. 당신이 만족 할 수 편집 당신은 당신이 제공하는 링크의 주요 지점을 포함하기 위해 확장합니다 대답? 이 사이트에서 검색하는 사람들과 링크가 끊어 질 경우 모두 도움이 될 것입니다. 그건 그렇고, 아직 투어를 하지 않은 경우 둘러보기 를하십시오. 응답 방법 , 도움말 형식화LaTeX / MathJax를 사용한 방정식 작성 에 대한 팁도 참조하십시오 .
Ertxiem-

귀하의 의견에 감사드립니다. 게시물을 편집하고 교정의 주요 단계를 스케치했습니다.
dennis
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.