무언가가 좋은 잦은 속성을 갖는 것은 무엇을 의미합니까?


12

나는 종종이 문구를 들었지만 그것이 무엇을 의미하는지 완전히 이해하지는 못했다. '좋은 잦은 속성'이라는 문구는 현재 Google에서 약 2750 개의 조회수, Scholar.google.com 에서 536 개, stats.stackexchange.com에서 4 개를 기록했습니다 .

나는 명확한 정의에 발견 된 가장 가까운 것은에서 오는 마지막 슬라이드 에서 이 스탠포드 대학 발표 하는 상태,

95 % 신뢰 구간을보고한다는 의미는 다른 추정 문제에서도 클레임의 95 %에서 실제 매개 변수를 "트랩"한다는 것입니다. 이것은 좋은 잦은 속성을 가진 추정 절차의 특징을 정의합니다. 반복적으로 사용될 때 정밀하게 조사합니다.

이것에 대해 조금만 생각해 보면, "좋은 잦은 속성"이라는 문구는 베이지안 방법, 특히 베이지안 간격 생성 방법에 대한 평가를 의미한다고 가정합니다. 베이지안 간격에는 확률 가 포함 된 모수의 실제 값이 포함되어 있음을 이해합니다 . 빈번한 간격은 간격 구성 프로세스가 여러 번 반복되는 경우 간격의 약 가 매개 변수의 실제 값을 포함하도록 구성되어야합니다. 베이지안 구간은 일반적으로 구간의 %가 매개 변수의 실제 값을 포함 할 것이라는 약속을하지 않습니다. 그러나 일부 베이지안 방법은 여러 번 반복하면 약 의 실제 값을 포함한다는 속성을 갖습니다.p * 100 % p * 100 %pp100%p100%그 시간의. 그들이 그 속성을 가질 때, 그들은 "좋은 잦은 속성"을 가지고 있다고 말합니다.

맞습니까? 문구 좋은 빈도주의를 의미하기 때문에, 그것보다 더이 있어야한다는 나는 그림 속성 오히려 좋은 빈도주의하는 것보다, 속성을 .


1
나는 당신 이이 질문을 생각한 방식을 정말로 좋아합니다. 해롤드 제프리스 경은 초기에 우도 함수처럼 행동하는 베이 시안 후부 분포를 만들려고 시도했으며 따라서 빈번한 특성을 가졌다. 따라서 "균일 한"사전 배포 구성에 해당합니다. 아이디어는 그러한 사전 수단을 사용하면 사전은 중립적이며 추론에 영향을 미치지 않는다는 것입니다. 따라서 이는 신뢰할 수있는 구간을 신뢰 구간처럼 보이게하는 것 이상에 적용됩니다. 그러나 Jeffreys는 "균일 한"사전이 적절하지 않은 경우가 있었기 때문에 문제가 발생했습니다.
Michael R. Chernick

1
부적절한 것은 사전 밀도가 1에 통합되지 않음을 의미합니다. Jeffreys는 베이지안 방법이 잦은 방법에 동의함으로써 정당화 될 필요가 있다고 생각한 것 같습니다. 베이지안은 그들이 주장하는 접근법의 가치가 추론에 영향을 미치는 사전 정보가 있고 따라서 적절한 "정보"이전을 사용하는 것을 선호하기 때문에이 개념을 거부했다.
Michael R. Chernick

2
@MichaelChernick : Bayes 추정기의 빈번한 속성을 찾는 Jeffreys에 대한 정확한 참조를 제공 할 수 있습니까? 나는이 이야기를 들어 본 적이 없다. 또한 Jeffreys가 부적절한 선행을 사용하는 것에 대해 전혀 걱정하지 않았으며 의심의 여지가 모두 이론입니다 .
Xi'an

나는 사랑 이 질문을!
Alexis

1
사실 @ Xi'an은 Beta-Binomial 모델의 경우 이전 Jeffreys가 아닌 잦은 추정으로 이어지는 Haldane입니다 (이 경우에는 적절합니다). 나는 또한 Jeffreys가 좋은 잦은 속성을 찾고 있다고 들었습니다. 나는 그가 객관적인 사전을 찾고 있다고 생각했으며, 객관적으로 그는 재 매개 변수화에서 변하지 않는 것을 의미했습니다.
DeltaIV

답변:


3

좋은 잦은 속성에 대한 까다로운 점은 특정 결과 나 추론의 속성이 아니라 프로 시저의 속성이라는 것입니다. 좋은 잦은 절차는 장기적으로 특정 비율의 사례에 대한 올바른 추론을 낳지 만, 베이지안 절차는 종종 해당 개별 사례에서 올바른 추론을하는 것입니다.

예를 들어, 증거 (우도 함수)와 사전 확률 분포의 조합을 올바르게 나타내는 사후 확률 분포 또는 신뢰할 수있는 간격을 제공하기 때문에 일반적인 의미에서 "좋은"베이지안 절차를 고려하십시오. 사전에 정확한 정보가 포함되어있는 경우 (예 : 빈 의견이나 정보가없는 사전 형식이 아닌) 해당 사후 또는 간격이 동일한 데이터의 빈번한 결과보다 더 나은 추론을 초래할 수 있습니다. 절차가 정확한 정보를 포함하는 사전 정의 된 사용자 정의를 사용하기 때문에이 특정 사례에 대한보다 정확한 추론 또는 더 좁은 추정 간격으로 이어지는 의미에서 더 좋습니다. 장기적으로 구간의 적용 범위 비율과 추론의 정확성은 각 이전의 품질에 영향을받습니다.

이 절차에는 이전의 획득 방법이 명시되어 있지 않으므로 장기적인 성능 회계는 아마도 각 경우에 대해 맞춤 설계 이전이 아닌 이전의 것으로 가정합니다.

베이지안 절차 는 좋은 잦은 속성을 가질 있습니다. 예를 들어, 많은 경우에 레시피가 제공하는 정보가없는 베이지안 절차는 우수한 잦은 속성에 상당히 적합합니다. 이러한 좋은 속성은 디자인 기능이 아니라 사고 일 수 있으며, 이러한 절차가 잦은 절차와 유사한 간격을 가져 오는 직접적인 결과 일 것입니다.

따라서 베이지안 절차는 개별 실험에서 우수한 추론 적 특성을 가지면서 장기적으로 빈번한 특성을 가질 수 있습니다. 마찬가지로 장기적인 잦은 잦은 속성을 가진 잦은 절차는 종종 개별 실험의 경우 성능이 떨어집니다.


2
나는 따르지 않는다. 경험적 베이를 제외하고, 모든 베이지안 절차에서 이전이 데이터와 독립적 으로 선택되는 것을 보았습니다 . 따라서 동일한 절차를 동일한 데이터 생성 프로세스 (빈도 프레임 워크)에서 오는 여러 데이터 세트에 적용 할 때 베이지안은 동일한 우도 함수 (데이터 생성 프로세스는 동일) 동일한 이전 (이전 대부분의 베이 즈 절차에서 데이터와 무관). 물론 데이터가 매번 바뀌기 때문에 가능성 의 가치 는 변하지 만 그 형태는 같습니다. 이제 각 개인 [1/2]
DeltaIV

2
[2/2] 추정치가 더 정확합니다. 전체 절차가 어떻게 덜 정확할 수 있습니까? 베이지안 추정값이 항상 더 정확하지 않은 경우에만 가능합니다. 그러나 이전의 데이터는 관찰 된 데이터에 맞게 사용자 정의되지 않았기 때문에 각 단일 사례 및 / 또는 "평균"에 대해 어느 정도 정확한지 확실하지 않습니다.
DeltaIV

@ DeltaV 나는 당신이 잘못된 참조 세트를 다루고 있다고 생각합니다. 절차의 빈번한 특성은 특정 실험의 반복뿐만 아니라 모든 새로운 경우에 적용되는 장기 수행 성능과 관련이 있습니다. 그렇기 때문에 이항 비율에 대한 신뢰 구간 절차는 절차가 사용되는 특정 인스턴스와 관련된 값뿐만 아니라 모수의 모든 값에 대해 작동해야합니다. 이러한 유형의 '장기'는 해당 사례에 적합한 사용자 정의 된 사전 설정이 장기에 적합하지 않음을 의미합니다.
Michael Lew

잦은 신뢰 절차는 알 수없는 매개 변수의 모든 값에 대해 공칭 적용 범위를 가져야합니다. 이것은 Newman & Pearson에 의해 명확하게 지정되었으며 오늘날 종종 간과됩니다. 그러나 이전을 선택하면 매개 변수의 "true"값이 무엇인지 알 수 없습니다. 샘플 만 가지고 있으며 이전 샘플은 샘플과 독립적이어야합니다. 따라서 샘플을 기반으로 사전을 사용자 정의하는 방법을 여전히 명확하게 알 수 없습니다. 실용적인 예를 만들 수 있습니까?
DeltaIV

@DeltaIV 이전 연구에서 현재 관심있는 매개 변수가 추정되었다는 것을 알고 있다면 해당 추정치를 기반으로 유익한 정보를 미리 형성 할 수 있습니다. 그 이전은이 현재 분석에 적합 할 것이나 장기적으로이 방법의 명목상의 응용에 이용 가능한 동등한 적절한 정보 이전은 없습니다. 따라서 고립 된 실제 사례의 경우 분석이 잦은 장기적인 경우보다 훨씬 더 나은 특성을 가질 수 있습니다.
Michael Lew

2

귀하의 분석이 정확하다고 답변합니다. 좀 더 통찰력을 제공하기 위해 일치하는 선행 사항을 언급하겠습니다.

일치하는 우선 순위는 일반적으로 빈번한 특성을 가진 베이지안 모델을 빌드하도록 설계된 우선 순위입니다. 특히, 획득 된 hpd 구간이 잦은 신뢰 구간 적용 범위를 만족하도록 정의됩니다 (따라서 95 % hpd의 95 %가 장기적으로 실제 값을 포함 함). 1d에는 분석 솔루션이 있습니다. Jeffreys 사전은 이전과 일치합니다. 더 높은 차원에서, 이것은 경우가 필요하지 않습니다 (내 지식으로는 이것이 결코 그렇지 않다는 것을 증명하는 결과는 없습니다).

실제로,이 매칭 원리는 때때로 모델의 일부 파라미터의 값을 조정하기 위해 적용되기도합니다. 근거 데이터는 해당 파라미터의 값이 해당 파라미터에 대한 신뢰할 수있는 결과 간격의 잦은 범위를 최대화한다는 의미에서 이러한 파라미터를 최적화하는 데 사용됩니다. . 내 자신의 경험으로 볼 때 이것은 매우 미묘한 작업 일 수 있습니다.


0

내가 기여할 수있는 부분이 있으면 먼저 설명을 추가 한 다음 질문에 직접 대답하십시오. 이 주제 (베이지 절차의 주된 특성)에 대해 많은 혼란이 있으며 전문가들 사이의 의견 불일치도 있습니다. 첫 번째 오해는 "베이지안 간격은 확률 갖는 모수의 실제 값을 포함하는 것 "입니다. 순수한 베이지안 (베이지 절차를 평가하기 위해 빈번한 개념을 채택하지 않은) 인 경우 "참 매개 변수"와 같은 것은 없습니다. 빈번한 세계에서 고정 된 매개 변수 인 주요 관심 수량은 베이지안 세계에서 랜덤 변수입니다. 베이지안에서는 매개 변수의 실제 값을 복구하지 않고 "매개 변수"또는 해당 모멘트의 분포를 복구합니다.p

이제 귀하의 질문에 대답하기 위해 : 아니오, 베이지안 방법의 평가를 암시하지 않습니다. 뉘앙스를 건너 뛰고 단순하게 유지하기 위해 추정 절차에 집중합니다. 통계의 빈번 함은 알 수없는 고정 수량을 추정하거나 가설을 테스트하고 가상의 반복에 대해 그러한 절차를 평가한다는 아이디어입니다. 절차를 평가하기 위해 많은 기준을 채택 할 수 있습니다. 이를 빈번한 기준으로 삼는 이유는 동일한 절차를 반복해서 채택하면 어떤 일이 발생하는지에 관심이 있다는 것입니다. 그렇게하면 빈번한 속성에 관심을 갖습니다. 다시 말해 : "자주 주의적 속성은 무엇입니까?" "절차를 반복해서 반복하면 어떻게됩니까?" 이제 그러한 빈번한 속성이 좋은 이유기준의 또 다른 층입니다. 좋은 속성 으로 간주되는 가장 일반적인 잦은 속성 은 일관성 (추정에서 추정을 계속하면 샘플링하는 추정값으로 수렴됩니다), 효율성 (샘플링을 계속하면 추정기의 분산은 0이됩니다) 그래서 당신이) 더 정확합니다, 포함 확률(다수의 반복 과정에서 95 % 신뢰 구간에는 시간의 실제 값 95 %가 포함됩니다). 처음 두 가지는 큰 샘플 속성이라고하며, 세 번째는 반드시 점근 적 결과를 사용할 필요가 없다는 점에서 Neyman의 정품 속성입니다. 요약하자면, 잦은 프레임 워크에는 진실하고 알려지지 않은 가치가 있습니다. 당신은 그것을 추정하고 당신은 추정에서 항상 (드문 운이 좋은 사고를 제외하고) 틀렸지 만, 적어도 추정에 근거한 추정의 무한 반복에서 당신은 점점 더 잘못 되거나당신은 당신이 특정 시간에 맞을 것이라는 것을 알고 있습니다. 귀하의 질문이 아니기 때문에 그것이 의미가 있는지 아닌지, 또는 그것을 정당화하는 데 필요한 추가 가정에 대해서는 논의하지 않을 것입니다. 개념적으로, 이는 빈번한 속성이 참조하는 것과 그러한 맥락에서 일반적으로 좋은 수단입니다.

나는이 논문을 지적함으로써 당신을 닫을 것이다. 그래서 당신은 그것이 타당하고 좋은 잦은 속성을 갖는 베이지안 절차를 의미하는지 스스로 판단한다.

  • Little, R. 및 기타 (2011). 일반적으로 통계 및 누락 된 데이터에 대한 보정 된 베이. 통계 과학, 26 (2), 162–174.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.