독일 전차 문제 해결


10

용액받는 것을 공식적인 증명 있는가 독일어 탱크 문제점 의 함수 파라미터 k는 (관측 된 샘플의 수)와 m (관찰 시료 중에서 최대 값)? 다시 말해, 솔루션이 최대 값 외에 다른 샘플 값과 독립적이라는 것을 증명할 수 있습니까?


3
당신이 요구하는 것은 샘플 최대 값이 1에서 까지의 이산 균일 분포의 상한을 지정하는 매개 변수 충분 하다는 것을 보여주는 방법 입니다. θθθ
Scortchi-Monica Monica 복원

2
Fisher Neyman 인수 분해 정리 매개 변수 (탱크 수)을 고려한 관측 된 샘플의 확률 함수 (최대 요약 )는 및 \ Pr (M = m | n의 관점에서 완전히 기록 될 수 있음) , k) = \ begin {cases} 0 & \ text {if} m> n \\ \ frac {\ binom {m-1} {k-1}} {\ binom nk} & \ text {if} m \ leq n, \ end {cases} 대답이 되겠습니까? kmnkm
Pr(M=m|n,k)={0if m>n(m1k1)(nk)if mn,
Sextus Empiricus

@Scortchi 맞습니다. 더 명확하게 표현해 주셔서 감사합니다.
Bogdan Alexandru

@MartijnWeterings 아니오; 본질적으로 나는 솔루션 실제로 계산 하지 않고 샘플 최대가 솔루션에 충분하다는 증거를 요구합니다 (위의 Scortchi의 의견 인용) .
Bogdan Alexandru

따라서 피셔 네이 먼 인수 분해 정리를 증거로 찾고 있지 않습니까?
Sextus Empiricus

답변:


15

확률 이론의 일반적인 문제 는 특정 모형과 관련 매개 변수 ( 라고 함)가있을 때 관측치 의 확률을 나타 냅니다. 예를 들어 카드 게임이나 주사위 게임의 특정 상황에 대한 확률은 종종 매우 간단합니다.x1,x2,...,xnθ

그러나 많은 실제 상황에서 우리는 상황을 다루고 있습니다 ( 추론 적 통계 ). 즉, 관찰 가 주어졌고 이제 모델을 알 수 없거나 적어도 특정 매개 변수 알지 못합니다 .x1,x2,...,xkθ

이러한 유형의 문제에서 우리는 종종 매개 변수 가능성 이라는 용어를 언급하는데 , 이는 관측치 주어진 특정 매개 변수 를 믿는 비율입니다 . 이 항은 모형 매개 변수 가 가정적으로 참 이라고 가정 할 때 관측치 에 대한 확률에 비례하는 것으로 표현됩니다 . L(θ)θx1,x2,..xkx1,x2,..xkθ

L(θ,x1,x2,..xk)probability observations x1,x2,..xk given θ 

주어진 모수 값 에 대해 특정 관측치 이 (다른 모수 값과의 확률에 비해) 가능성이 높을수록 관측치가이 특정 모수 (또는이 모수를 가정하는 이론 / 가설)를 더 많이 지원합니다. . (상대적인) 높은 가능성은 그 매개 변수 값에 대한 우리의 믿음을 강화시킬 것입니다 (이에 대해 훨씬 더 철학적입니다 ).θx1,x2,..xn


독일 전차 문제 가능성

이제 독일 탱크 문제의 경우 샘플 대한 우도 함수 는 다음과 같습니다.x1,x2,..xk

L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0if max(x1,x2,..xk)>θ(θk)1if max(x1,x2,..xk)θ,

표본 {1, 2, 10} 또는 표본 {8, 9, 10}을 관찰하는지 여부 는 표본이 모수 균일 분포에서 고려 될 때 중요하지 않습니다 . 두 샘플 모두 확률이 일 가능성이 높으며 가능성에 대한 아이디어를 사용하여 한 샘플이 다른 샘플보다 매개 변수 에 대해 더 많은 것을 알려주지 않습니다 .θ(θ3)1θ

높은 값 {8, 9, 10}은 가 더 높아야 한다고 생각 / 믿게 만들 수 있습니다. 그러나,입니다 진정으로 당신의 가능성에 대한 관련 정보를 제공하는 값 {10} (값 10 있음을 알려줍니다 10 개 더 높을 것이다, 다른 값 8, 9는이 정보에 아무것도 기여하지 않는를 ).θθθ


피셔 네이 만 인수 분해 정리

이 정리 는 특정 통계 (즉, 평균, 중앙값 또는 독일 탱크 문제에서와 같이 관측의 일부 기능이 최대 임)가 충분할 때 (모든 정보를 포함 함) 알려줍니다 우도 함수에서 다른 관측치 에 종속 된 항을 인수 하여이 인수가 매개 변수 및 (및 데이터를 가상의 파라미터 값과 관련시키는 우도 함수의 일부는 통계에만 의존하지만 전체 데이터 / 관측에 의존하지는 않습니다).T(x1,x2,,xk)x1,x2,,xkθx1,x2,,xk

독일 전차 문제는 간단합니다. 위의 우도에 대한 전체 표현식은 이미 통계 에만 의존 하고 나머지 값 는 중요하지 않습니다.max(x1,x2,..xk)x1,x2,..xk


예를 들어 작은 게임

다음과 같은 게임을 반복적으로한다고 가정 해 봅시다 : 는 그 자체로 임의의 변수이며 100 또는 110의 동일한 확률로 그려집니다. 그런 다음 샘플을 그립니다 .θx1,x2,...,xk

우리는 추측을위한 전략 선택합니다 관찰을 기반으로, 의 오른쪽 추측이 우리의 가능성을 극대화 .θx1,x2,...,xkθ

표본의 숫자 중 하나가> 100이 아닌 경우 100을 선택하는 것이 올바른 전략입니다.

많은 값이 모두 100에 가까워 질 때 (그러나 정확히 100을 넘지 않는) 매개 변수 값 110을 선택하려고 할 수 있지만, 이는 잘못된 것입니다. 실제 관측치 값이 110 일 때보 다 100 일 때 그러한 관측에 대한 확률이 더 커집니다. 따라서 이러한 상황에서 매개 변수 값으로 100을 추측하면 실수를 할 가능성이 줄어 듭니다. 이러한 높은 값이 수백에 가까우지만 여전히 그 아래 인 상황은 실제 값이 110 인 경우보다는 실제 값이 100 인 경우에 더 자주 발생합니다.x1,x2,...,xk


굉장히 내가 필요한 것! 마지막 괄호에 대한 한 가지 의견 : 당신은 "100에 가까운 높은 값이 더 자주 발생합니다 ..."라고 말하고 있습니다. 왜 그런지 사실인지 이해하지만, 명확히하기 위해 : 1에서 100 사이의 모든 값이 발생할 가능성이 높습니다 매개 변수가 100 인 경우 (기본적으로 1-100의 각 숫자에 대한 확률은 1 / 매개 변수 임)
Bogdan Alexandru

또한 내 게시물에 대한 귀하의 초기 의견은 의미가 있습니다. 이러한 개념을 적용하는 방법을 알고 있다면 귀하의 의견은 증거를 얻는 데 필요한 힌트 일 것입니다. 다시 감사합니다!
Bogdan Alexandru

@BogdanAlexandru 당신이 맞습니다; 1-100 사이의 모든 값에 해당됩니다. 즉, 반 직관적 인 아이디어입니다. 우리는 높은 관측 값이 낮은 관측 값보다 일부 매개 변수 값에 대해 더 많은 증거라고 생각하는 경향이 있지만 모든 수에 대해 똑같이 가능성이 높으므로 모델 매개 변수에 대한 우리의 생각에 아무런 영향을 미치지 않습니다 ( 우리가 관찰 한 최대 값을 제외하고 그러나 두 값 중 하나만 선택하여 만든 게임에서도 최대 값도 백 경계를 제외하고는 더 높거나 낮을 때 더 많은 정보를 제공하지 않습니다.
Sextus Empiricus

내 초기 의견이 너무 무거웠을지 모르지만, 나는 어떤 종류의 대답이 필요한지를 파고 들었습니다. 특히 나는 '증거'라는 용어가 약간 강력하다는 것을 알았으며 단지 인수 분해 이론을 찾고 있었는지 (그 정리를 모르는 경우 예라고 대답 할 것입니다) 또는 더 모호한 것을 찾고 있는지 궁금합니다. 도전적인 통계 / 우월성 개념과 같은 이론을 넘어서서 그런 이론을 넘어서 다른 유형의 "증거"를 찾는 철학적.
Sextus Empiricus

내 의도를 잘 읽어보세요! 다시 감사합니다.
Bogdan Alexandru

0

당신은 "문제"의 정확한 공식을 제시하지 않았으므로, 당신이 무엇을 증명해야하는지 명확하지 않습니다. 베이지안 관점에서 사후 확률은 모든 데이터에 의존합니다. 그러나 특정 일련 번호를 관찰 할 때마다 해당 번호가 가장 많이 지원됩니다. 즉, 임의의 관찰 주어지면 , "실제 탱크 수는 [ ] 이외의 수"에 대한 것보다 " 실제 탱크 수는 " 이라는 가설에 대해 후방과 이전의 승산 비가 더 클 것이다 . 따라서 우리가 이전에 균일하게 시작한다면, 관측을 본 후 이 가장 높은 후방을 가질 것입니다.nnnn

데이터 포인트가 이고 가설 경우를 생각해보십시오 . 분명히, 의 후부 는 0입니다. 그리고 대한 우리의 후부는 이전보다 더 클 것입니다. 그 이유는 베이지안 추론에서 증거의 부재 부재의 증거 이기 때문 입니다. 우리는 우리의 가능성을 줄 였지만 그렇지 않은 확률로 관찰 할 있는 기회를 가질 때마다 . 의 후부 를 0으로 설정 한 을 볼 있었 으므로 이를 보지 못했다는 것은 우리의 후부를 증가시켜야 함을 의미합니다13N=10,13,15N=10N=13,1516N=13,15N=13,15 . 그러나 숫자가 작을수록 해당 숫자를 배제한 숫자가 많을 수 있습니다. 를 들어 , 우리가보고 난 후에 그 가설을 거부했을 . 그러나 이면 가설을 기각하기 위해 최소한 이상이 필요했을 것 입니다. 가설 때문에 보다 더 반증이다 , 사실 우리는 하지 않았다 위조 에 대한 더 많은 증거이다 위조하지보다, 에 대한 증거 .N=1314,15,16,...N=1516N=13N=15N=13N=13N=15N=15

따라서 우리는 데이터 포인트를 볼 때마다 그 아래 모든 것의 후부를 0으로 설정하고 다른 모든 것의 후부를 증가시킵니다. 따라서 전체적으로 가장 큰 부스트를 얻는 숫자는 후부가 0으로 설정되지 않은 가장 작은 숫자, 즉 관측치의 최대 값입니다.

최대 값보다 작은 숫자는 최대 증가가 얼마나 크게 증가 하는지에 영향을 미치지 만 최대 증가가 증가하는 일반적인 추세에는 영향을 미치지 않습니다. 우리가 이미 본 위의 예를 고려하십시오 . 다음 숫자가 이면 어떤 영향을 미칩니 까? 이상 도와 주지만 두 숫자는 이미 거부되었으므로 관련이 없습니다. 이상 도와 주지만 이상 은 이미 이상 도움이되었으므로 가장 많은 도움을받은 숫자에는 영향을 미치지 않습니다.1355613151315


이 예는 상황에 따라 크게 다르며 진술은 일반적이지 않습니다. 예를 들어, 선행이 13의 경우 50 %, 15의 경우 50 % 인 경우 13의 관측치가 "N = 13, 15에 대한 우리의 후부가 이전보다 더 클 것" 이 아닙니다. 관찰은 이전에 비해 후방을 줄일 수 있습니다 .
Sextus Empiricus

또한 더 많은 숫자를 관찰하면 추론이 변경 될 수 있습니다. 경우에 "우리가 볼 다음 번호가 5이면 ..." 당신은 모든 숫자를 샘플링 할 때 다음 후방 여전히 변화, 숫자가 이미왔다 경우에도 '도와'것, 추가 번호는 ( '이 "도와 예를 높일 수 있습니다 1,2, ... 12, 13 그러면 샘플 13보다 더 후부 13이 더 커집니다.)
Sextus Empiricus
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.