용액받는 것을 공식적인 증명 있는가 독일어 탱크 문제점 의 함수 만 파라미터 k는 (관측 된 샘플의 수)와 m (관찰 시료 중에서 최대 값)? 다시 말해, 솔루션이 최대 값 외에 다른 샘플 값과 독립적이라는 것을 증명할 수 있습니까?
용액받는 것을 공식적인 증명 있는가 독일어 탱크 문제점 의 함수 만 파라미터 k는 (관측 된 샘플의 수)와 m (관찰 시료 중에서 최대 값)? 다시 말해, 솔루션이 최대 값 외에 다른 샘플 값과 독립적이라는 것을 증명할 수 있습니까?
답변:
확률 이론의 일반적인 문제 는 특정 모형과 관련 매개 변수 ( 라고 함)가있을 때 관측치 의 확률을 나타 냅니다. 예를 들어 카드 게임이나 주사위 게임의 특정 상황에 대한 확률은 종종 매우 간단합니다.
그러나 많은 실제 상황에서 우리는 역 상황을 다루고 있습니다 ( 추론 적 통계 ). 즉, 관찰 가 주어졌고 이제 모델을 알 수 없거나 적어도 특정 매개 변수 알지 못합니다 .
이러한 유형의 문제에서 우리는 종종 매개 변수 가능성 이라는 용어를 언급하는데 , 이는 관측치 주어진 특정 매개 변수 를 믿는 비율입니다 . 이 항은 모형 매개 변수 가 가정적으로 참 이라고 가정 할 때 관측치 에 대한 확률에 비례하는 것으로 표현됩니다 .
주어진 모수 값 에 대해 특정 관측치 이 (다른 모수 값과의 확률에 비해) 가능성이 높을수록 관측치가이 특정 모수 (또는이 모수를 가정하는 이론 / 가설)를 더 많이 지원합니다. . (상대적인) 높은 가능성은 그 매개 변수 값에 대한 우리의 믿음을 강화시킬 것입니다 (이에 대해 훨씬 더 철학적입니다 ).
이제 독일 탱크 문제의 경우 샘플 대한 우도 함수 는 다음과 같습니다.
표본 {1, 2, 10} 또는 표본 {8, 9, 10}을 관찰하는지 여부 는 표본이 모수 균일 분포에서 고려 될 때 중요하지 않습니다 . 두 샘플 모두 확률이 일 가능성이 높으며 가능성에 대한 아이디어를 사용하여 한 샘플이 다른 샘플보다 매개 변수 에 대해 더 많은 것을 알려주지 않습니다 .
높은 값 {8, 9, 10}은 가 더 높아야 한다고 생각 / 믿게 만들 수 있습니다. 그러나,입니다 만 진정으로 당신의 가능성에 대한 관련 정보를 제공하는 값 {10} (값 10 있음을 알려줍니다 10 개 더 높을 것이다, 다른 값 8, 9는이 정보에 아무것도 기여하지 않는를 ).
이 정리 는 특정 통계 (즉, 평균, 중앙값 또는 독일 탱크 문제에서와 같이 관측의 일부 기능이 최대 임)가 충분할 때 (모든 정보를 포함 함) 알려줍니다 우도 함수에서 다른 관측치 에 종속 된 항을 인수 하여이 인수가 매개 변수 및 (및 데이터를 가상의 파라미터 값과 관련시키는 우도 함수의 일부는 통계에만 의존하지만 전체 데이터 / 관측에 의존하지는 않습니다).
독일 전차 문제는 간단합니다. 위의 우도에 대한 전체 표현식은 이미 통계 에만 의존 하고 나머지 값 는 중요하지 않습니다.
다음과 같은 게임을 반복적으로한다고 가정 해 봅시다 : 는 그 자체로 임의의 변수이며 100 또는 110의 동일한 확률로 그려집니다. 그런 다음 샘플을 그립니다 .
우리는 추측을위한 전략 선택합니다 관찰을 기반으로, 의 오른쪽 추측이 우리의 가능성을 극대화 .
표본의 숫자 중 하나가> 100이 아닌 경우 100을 선택하는 것이 올바른 전략입니다.
많은 값이 모두 100에 가까워 질 때 (그러나 정확히 100을 넘지 않는) 매개 변수 값 110을 선택하려고 할 수 있지만, 이는 잘못된 것입니다. 실제 관측치 값이 110 일 때보 다 100 일 때 그러한 관측에 대한 확률이 더 커집니다. 따라서 이러한 상황에서 매개 변수 값으로 100을 추측하면 실수를 할 가능성이 줄어 듭니다. 이러한 높은 값이 수백에 가까우지만 여전히 그 아래 인 상황은 실제 값이 110 인 경우보다는 실제 값이 100 인 경우에 더 자주 발생합니다.
당신은 "문제"의 정확한 공식을 제시하지 않았으므로, 당신이 무엇을 증명해야하는지 명확하지 않습니다. 베이지안 관점에서 사후 확률은 모든 데이터에 의존합니다. 그러나 특정 일련 번호를 관찰 할 때마다 해당 번호가 가장 많이 지원됩니다. 즉, 임의의 관찰 주어지면 , "실제 탱크 수는 [ ] 이외의 수"에 대한 것보다 " 실제 탱크 수는 " 이라는 가설에 대해 후방과 이전의 승산 비가 더 클 것이다 . 따라서 우리가 이전에 균일하게 시작한다면, 관측을 본 후 이 가장 높은 후방을 가질 것입니다.
데이터 포인트가 이고 가설 경우를 생각해보십시오 . 분명히, 의 후부 는 0입니다. 그리고 대한 우리의 후부는 이전보다 더 클 것입니다. 그 이유는 베이지안 추론에서 증거의 부재 가 부재의 증거 이기 때문 입니다. 우리는 우리의 가능성을 줄 였지만 그렇지 않은 확률로 관찰 할 수 있는 기회를 가질 때마다 . 의 후부 를 0으로 설정 한 을 볼 수 있었 으므로 이를 보지 못했다는 것은 우리의 후부를 증가시켜야 함을 의미합니다 . 그러나 숫자가 작을수록 해당 숫자를 배제한 숫자가 많을 수 있습니다. 를 들어 , 우리가보고 난 후에 그 가설을 거부했을 . 그러나 이면 가설을 기각하기 위해 최소한 이상이 필요했을 것 입니다. 가설 때문에 보다 더 반증이다 , 사실 우리는 하지 않았다 위조 에 대한 더 많은 증거이다 위조하지보다, 에 대한 증거 .
따라서 우리는 데이터 포인트를 볼 때마다 그 아래 모든 것의 후부를 0으로 설정하고 다른 모든 것의 후부를 증가시킵니다. 따라서 전체적으로 가장 큰 부스트를 얻는 숫자는 후부가 0으로 설정되지 않은 가장 작은 숫자, 즉 관측치의 최대 값입니다.
최대 값보다 작은 숫자는 최대 증가가 얼마나 크게 증가 하는지에 영향을 미치지 만 최대 증가가 증가하는 일반적인 추세에는 영향을 미치지 않습니다. 우리가 이미 본 위의 예를 고려하십시오 . 다음 숫자가 이면 어떤 영향을 미칩니 까? 이상 도와 주지만 두 숫자는 이미 거부되었으므로 관련이 없습니다. 이상 도와 주지만 이상 은 이미 이상 도움이되었으므로 가장 많은 도움을받은 숫자에는 영향을 미치지 않습니다.