파라 메트릭 및 비 파라 메트릭 부트 스트랩에 대한 질문


14

Kevin Murphy의 저서 " Machine Learning-A Probabilistic Perspective " 에서 상용 통계에 관한 장을 읽고 있습니다. 부트 스트랩 섹션은 다음과 같습니다.

부트 스트랩은 샘플링 분포를 근사화하는 간단한 Monte Carlo 기술입니다. 추정기가 실제 모수의 복잡한 함수 인 경우에 특히 유용합니다.

아이디어는 간단하다. 우리가 진정한 매개 변수를 안다면 , 우리는 많은 (말을 생성 할 수있는 S를 ) 가짜 데이터 세트, 크기의 각 N 진정한 분포에서를, X I ~ P ( · | θ * ) 에 대한 S = 1 : S , I = 1 : N . 그런 다음 각 샘플에서 추정값을 계산할 수 있습니다. ^ θ s = f ( x s 1 : N )θSNxisp(·|θ)s=1:S,i=1:Nθs^=f(x1:Ns)샘플링 분포의 추정치로 결과 샘플의 경험적 분포를 사용합니다. 이후 알려져 있지의 아이디어 파라 메트릭 부트 스트랩을 사용하여 샘플을 생성하는 것입니다 θ ( D ) 대신합니다.θθ^(D)

비모수 부트 스트랩 이라고하는 대안 은 원래 데이터 D 에서 (대체) 를 샘플링 한 다음 이전과 같이 유도 된 분포를 계산하는 것입니다. 대규모 데이터 세트에 적용될 때 부트 스트랩 속도를 높이는 몇 가지 방법은 (Kleiner et al. 2011)에 설명되어 있습니다.xisD

  • 1 . 본문은 말합니다 :

    실제 모수 알고 있다면 각 표본으로부터 추정량을 계산할 수 있습니다. ^ θ s ...θθs^

        그러나 이미 실제 모수 알고 있다면 왜 각 샘플의 추정기를 사용 합니까?θ

  • 2 . 또한 경험적 분포와 샘플링 분포의 차이점은 무엇입니까?

  • 3 . 마지막으로, 나는 이 텍스트에서 파라 메트릭비 파라 메트릭 부트 스트랩 의 차이점을 이해하지 못합니다 . 둘 다 관측치 D 에서 를 추론 하지만 정확히 차이점은 무엇입니까?θD

답변:


14

miura가 제공 한 답변은 완전히 정확하지 않으므로 후손에 대한이 오래된 질문에 대답하고 있습니다.

(2). 이것들은 매우 다릅니다. 경험적 cdf는 데이터를 생성 한 CDF (분포)의 추정치입니다. 구체적으로,이 확률 할당 이산 CDF 인 각 관측 데이터 포인트는 F ( X ) = 11/n에 대한 각X. 진정한 CDF이 추정의 수렴 : F (X)F(X)=P(XIX)거의 확실하게 각X(사실 균일).F^(x)=1ni=1nI(Xix)xF^(x)F(x)=P(Xix)x

통계량 의 샘플링 분포는 반복 실험에서 볼 수있는 통계량의 분포입니다. 즉, 실험을 한 번 수행하고 데이터 X 1 , , X n을 수집합니다 . T 는 데이터의 함수입니다. T = T ( X 1 , , X n ) . 이제, 실험하고, 수집 된 데이터의 반복 가정 X ' 1 , ... , X를 ' N . 새로운 샘플에서 T를 재 계산하면 T 'TX1,,XnTT=T(X1,,Xn)X1,,Xn . 100 개의 샘플을 수집하면 T의 추정치가 100이됩니다. 이러한 관찰 T는 의 샘플링 분포를 형성 T를 . 진정한 분포입니다. 실험의 수는 무한대까지의 평균 수렴 갈수록 E ( T ) 및 그것의 분산 V R ( T를 ) .T=T(X1,,Xn)TTTE(T)Var(T)

일반적으로 우리는 이와 같은 실험을 반복하지 않으며 인스턴스는 하나만 보입니다 . 의 분산 알아내는 T는 당신의 기본 확률 함수 모르는 경우 하나의 관찰에서 것은 매우 어렵 T 선험적. 부트 스트랩은의 샘플링 분포를 추정하는 방법입니다 T를 인위적으로의 새로운 인스턴스 계산하는 "새로운 실험"를 실행하여 T를 . 각각의 새로운 샘플은 실제로 원래 데이터의 리 샘플입니다. 원본 데이터보다 더 많은 정보를 제공한다는 것은 신비 롭고 정말 대단합니다.TTTTT

(1). 당신은 맞습니다 – 당신은 이것을하지 않을 것입니다. 저자는 파라 메트릭 부트 스트랩을 "분배를 알고 있다면 무엇을 할 것인지"로 설명하면서 분포 부트 스트랩에 동기를 부여하려고하지만, 분포 함수의 아주 좋은 추정값 인 경험적 CDF를 대체합니다.

예를 들어 검정 통계량 가 일반적으로 평균 0, 분산 1로 분포되어 있다고 가정합니다 . T 의 샘플링 분포를 어떻게 추정 할 수 있습니까? 분포를 알기 때문에 샘플링 분포를 추정하는 어리 석고 중복되는 방법은 R을 사용하여 10,000 개 정도의 표준 정규 확률 변수를 생성 한 다음 표본 평균 및 분산을 취하여이를 평균 및 샘플링 분포의 분산 T .TTT

우리 의 매개 변수를 사전에 알지 못하지만 정상적으로 분포되어 있다는 것을 알고 있다면 대신 경험적 cdf에서 10,000 개 정도의 샘플을 생성 하고 각각에 대해 T 를 계산 한 다음 샘플 평균을 취하는 것입니다 이러한 10,000 T 의 분산을 예측 값 T 의 추정치로 사용합니다 . 경험적 cdf는 실제 cdf를 잘 추정하기 때문에 샘플 매개 변수는 실제 매개 변수로 수렴해야합니다. 이것은 파라 메트릭 부트 스트랩입니다. 추정하려는 통계량에 모형을 배치합니다. 모형은 매개 변수에 의해 색인화됩니다 ( 예 : ( μ , σ )TTTT(μ,σ)ecdf에서 반복 샘플링으로 추정합니다.

(삼). 비모수 부트 스트랩은 가 정규 분포 되어 있다는 우선 순위를 알 필요조차 없습니다 . 대신, ecdf에서 반복 된 샘플을 추출하고 각각에 대해 T 를 계산 합니다. 10,000 개 정도의 샘플을 그리고 10,000 Ts를 계산 한 후 추정 히스토그램을 플로팅 할 수 있습니다. 이것은 T 의 샘플링 분포를 시각화 한 것입니다TTTT. 비모수 부트 스트랩은 샘플링 분포가 정상 또는 감마 등임을 나타내지 않지만 필요한 경우 정확하게 샘플링 분포를 추정 할 수 있습니다. 파라 메트릭 부트 스트랩보다 가정이 적고 정보가 적습니다. 모수 가정이 참일 때는 정확하지 않지만 거짓 일 때는 더 정확합니다. 각 상황에서 사용하는 것은 전적으로 상황에 달려 있습니다. 분명히 더 많은 사람들이 비모수 적 부트 스트랩에 익숙하지만 종종 약한 모수 적 가정은 완전히 다루기 어려운 모델을 추정하기에 좋게 만듭니다.


1
파라 메트릭 부트 스트랩에 대한 설명이 혼란 스럽습니다. "대신 경험적인 CDF에서 10,000 개 정도의 샘플을 생성하는 것"이라는 파라 메트릭 부트 스트랩에 대한 설명이 혼란 스럽습니다. 이것이 머피 (Murphy) 책의 원래 인용문에서 설명한 것입니다. 내가 잘못 읽을 수는 있지만 경험적 CDF에서 샘플링하면 데이터 포인트를 직접 샘플링하는 것입니다. 이는 표준 부트 스트랩입니다.
user20160

@ user20160 당신은 대답의 "대신"을 잘못 해석하고 있습니다 : 그는 파라 메트릭이 아닌 비 파라 메트릭 부트 스트랩을 설명하고 있습니다.
알다

4

나는 guest47의 노력에 진심으로 감사하지만, 사소한 측면에서 그의 대답에 동의하지 않습니다. 나는 내 의견 불일치를 직접 제기하지 않고 오히려이 답변에 반영합니다.

  1. θ^sθθ^sθ

  2. Guest47은 좋은 답변을 제공합니다. 더 정교하게 할 필요가 없습니다.

  3. θ^θθ^, and estimate θ^s for these models. In nonparametric bootstrapping, you directly use D, sample (for thousands of times) exactly from D, instead of from generated data.


2

I'm no expert, but for what it's worth:

  1. Because you're interested in the sampling distribution, as mentioned in the first sentence of your quotation.

  2. The empirical distribution is the distribution you see in your finite number of samples. The sampling distribution is what you would see were you to take an infinite number of samples.

I can't answer 3. I always understood what is described here as nonparametric bootstrap as "the" bootstrap.

If you have not already fully grasped the concept of the sampling distribution, there is a really nice thread here that features very illustrative R code.


5
The difference between the parametric and nonparametric bootstrap is that the former generates its samples from the (assumed) distribution of the data, using the estimated parameter values, whereas the latter generates its samples by sampling with replacement from the observed data - no parametric model assumed.
jbowman

@jbowman - the "non-parametric" bootstrap does have an underlying model - just that it is a different model to the one used to motivate the parameter estimate.
probabilityislogic

@miura Please don't vandalize your answer. If you want the asker to choose a different answer, comment under the question. If you want your answer deleted, please flag it and ask for that.
Glen_b -Reinstate Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.