그래서 나는 당신이 참조하는 overfitting에 관한 질문에 대답했고 비디오를보고 블로그 게시물을 읽었습니다. Radford Neal은 베이지안 모델이 과적 합하지 않는다고 말하지 않습니다. 과적 합은 잡음이 신호로 취급되고 모수 추정치에 영향을 미치는 현상이라는 것을 기억하자. 이것이 모델 선택 오류의 유일한 원인은 아닙니다. Neal의 논의는 과적 합에 대한 논의에 참여한 작은 표본 크기에 대한 아이디어를 도입함으로써 더 광범위 해졌다.
베이지안 모형이 모든 베이지안 모형에 과적 합 될 수 있지만 예측을 향상시키는 방식으로 이전 적합성 게시물을 부분적으로 수정하겠습니다. 다시, 혼잡 한 신호를 잡음과 혼동하는 정의로 돌아가서, 베이지안 방법의 불확실성, 사후 분포는 신호와 잡음이 무엇인지에 대한 불확실성의 정량화입니다. 그렇게함으로써, 베이지안 방법은 전체 후부가 추론 및 예측에 사용되기 때문에 신호 추정치에 잡음을 부여한다. 과적 합 및 기타 모델 분류 오류 소스는 베이지안 방법에서 다른 유형의 문제입니다.
단순화하기 위해 Ma의 대화 구조를 채택하고 선형 회귀에 초점을 맞추고 딥 러닝 토론을 피하십시오. 그가 지적한 바와 같이, 그가 언급 한 대체 방법은 함수의 구성 일 뿐이며 선형 논리 사이에 직접적인 연관이 있기 때문입니다. 회귀 및 딥 러닝.
다음과 같은 잠재적 모델을 고려하십시오
와이=β0+β1엑스1+β2엑스2+β삼엑스삼.
다양한 크기의 샘플을 만들 수 있습니다
엔 두 개의 하위 샘플로 구성
엔1,엔2, 어디
엔1 훈련 세트입니다
엔2유효성 검사 세트입니다. 몇 가지 경고에 따라 베이지안 방법에 별도의 교육 및 검증 세트가 필요하지 않은 이유를 알 수 있습니다.
이 논의를 위해 모델마다 하나씩 8 개의 매개 변수를 추가로 작성해야합니다. 그들은미디엄1…8. 그들은 다항 분포를 따르고 회귀 계수와 마찬가지로 적절한 우선 순위를 갖습니다. 여덟 모델은
와이=β0+β1엑스1+β2엑스2+β삼엑스삼,
와이=β0,
와이=β0+β1엑스1,
와이=β0+β2엑스2,
와이=β0+β삼엑스삼,
와이=β0+β1엑스1+β2엑스2,
와이=β0+β1엑스1+β삼엑스삼,
와이=β0+β2엑스2+β삼엑스삼,
와이=β0+β1엑스1,
와이=β0+β2엑스2,
과
와이=β0+β삼엑스삼.
이제 베이지안과 빈번한 방법의 차이점에 대해 살펴보아야합니다. 훈련 세트에서엔1,Frequentist 방법을 사용하는 모델러는 하나의 모델 만 선택합니다. 베이지안 방법을 사용하는 모델러는 그렇게 제한되지 않습니다. 베이지안 모델러는 모델 선택 기준을 사용하여 하나의 모델 만 찾을 수 있지만 모델 평균화를 자유롭게 사용할 수도 있습니다. 베이지안 모델러는 유효성 검사 세그먼트에서 중간에 선택된 모델을 자유롭게 변경할 수 있습니다. 또한 베이지안 방법을 사용하는 모델러는 선택과 평균화를 혼합하고 일치시킬 수 있습니다.
실제 사례를 제시하기 위해 78 개의 파산 모델을 테스트했습니다. 78 개 모델 중 76 개가 결합 된 사후 확률은 약 10 분의 1의 1 %입니다. 다른 두 모델은 각각 54 %와 46 %였습니다. 다행히도 그들은 변수를 공유하지 않았습니다. 두 모델을 모두 선택하고 다른 모델을 무시할 수있었습니다. 두 데이터에 대한 모든 데이터 요소가 있었을 때 두 모델의 사후 확률을 기반으로 한 예측을 평균화했습니다. 다른. 훈련 세트와 유효성 검사 세트가 있었지만 Frequentist가 가지고있는 것과 같은 이유는 아니 었습니다. 또한 매일 두 번의 비즈니스주기에 걸쳐 매일의 데이터로 후부를 업데이트했습니다. 즉, 유효성 검사 세트 끝의 내 모델은 훈련 세트 끝의 모델이 아닙니다. 베이지안 모델은 학습을 중단하지 않지만 상용 모델은 학습을 중단하지 않습니다.
더 깊이 들어가기 위해 모델을 구체적으로 살펴 보겠습니다. 훈련 샘플 중에 모델 선택을 사용하는 가장 적합한 Frequentist 모델과 Bayesian 모델이 일치하거나 모델 평균의 모델 가중치가 너무 커서 Frequentist 모델과 거의 구별 할 수 없다고 가정합니다. 우리는이 모델이
와이=β0+β1엑스1+β2엑스2+β삼엑스삼.
또한 자연의 진정한 모델은
와이=β0+β1엑스1+β삼엑스삼.
이제 유효성 검사 세트의 차이점을 고려해 봅시다. Frequentist 모델이 데이터에 과적 합되었습니다. 어느 시점에서엔나는2모델 선택 또는 검증 절차가 선택을 사실상 실제 모델로 변경했음을 나타냅니다. 또한, 모델 평균화가 사용 된 경우, 실제 모델은 실제로 모델 선택이 명확 해지기 훨씬 전에 예측에 가중치를 부여했습니다. ET Jaynes는 확률 이론에 대한 주제로이 문제를 논의하는 데 시간을 보냅니다. 나는 그 책을 직장에서 가지고 있으므로 좋은 인용을 얻을 수는 없지만 읽어야한다. ISBN은 978-0521592710입니다.
모델은 베이지안 사고의 매개 변수이며, 임의로 또는 원하는 경우 불확실합니다. 그 불확실성은 검증 과정 중에 끝나지 않습니다. 지속적으로 업데이트됩니다.
베이지안과 빈번한 방법의 차이점 때문에 고려해야 할 다른 유형의 사례가 있습니다. 첫 번째는 매개 변수 유추에서, 두 번째는 공식 예측에서 나옵니다. 베이지안 방법에서는 동일하지 않습니다. 베이지안 방법은 추론과 의사 결정을 공식적으로 분리합니다. 또한 모수 추정과 예측을 분리합니다.
일반성을 잃지 않고 모델이 성공할 것이라고 상상해 봅시다. σ2^<k그렇지 않으면 실패. 간단한 아이디어를 얻는 데 많은 추가 작업이 필요하기 때문에 다른 매개 변수는 무시합니다. 베이지안 방법을 사용하는 모델러의 경우 이것은 Frequentist 방법을 사용하는 것과는 매우 다른 유형의 질문입니다.
Frequentist의 경우 훈련 세트에 따라 가설 테스트가 형성됩니다. Frequentist 방법을 사용하는 모델러는 추정 분산이 크거나 같은지 테스트합니다.k 크기가 샘플 인 null을 거부하려고합니다. n2 발견 된 매개 변수에 매개 변수를 고정 n1.
베이지안 방법을 사용하는 모델러의 경우 샘플에서 매개 변수 추정값을 구성합니다. n1 그리고 사후 밀도 n1 샘플의 사전이 될 것입니다 n2. 교환 가능성이 있다고 가정하면, 사후 추정치가 보장됩니다.n2는 조인트 샘플로부터 형성된 확률 추정치의 단어의 모든 의미에서 동일하다. 두 샘플로 분할하는 것은 수학이 전혀 분할하지 않은 것과 같습니다.
예측의 경우 비슷한 문제가 있습니다. 베이지안 방법은 예측 분포가 각 관측치에 따라 업데이트되는 반면, 빈번도 방법은 표본의 끝에 동결됩니다n1. 예측 밀도는 다음과 같이 쓸 수 있습니다.Pr(x~=k|X). 만약x~ 예측이고 X 샘플입니다. 그러면 매개 변수가 어디에 있습니까? θ? Frequentist 예측 시스템이 존재하지만 대부분의 사람들은 포인트 추정값을 실제 모수로 취급하고 잔차를 계산합니다. 베이지안 방법은 하나의 단일 지점이 아니라 예측 밀도에 대한 각 예측의 점수를 매 깁니다. 이러한 예측은 Frequentist 솔루션에서 사용되는 포인트 방법과 다른 매개 변수에 의존하지 않습니다.
참고로 공식 Frequentist 예측 밀도는 표준 오류를 사용하여 존재하며 점수를 매길 수는 있지만 실제로는 드 rare니다. 특정한 사전 지식이 없다면, 두 세트의 예측은 동일한 데이터 포인트 세트에 대해 동일해야합니다. 그들은 결국 다른 결과가 될 것입니다n1+n2>n1 Bayesian 솔루션은 더 많은 정보를 제공 할 것입니다.
중요한 사전 정보가없고 점 추정치보다 Frequentist 예측 밀도를 사용하는 경우 고정 표본의 경우 단일 모형을 선택하면 베이지안 및 Frequentist 방법의 결과가 동일합니다. 사전 정보가있는 경우 베이지안 방법은보다 정확한 예측을 생성하는 경향이 있습니다. 이 차이는 실제로 매우 클 수 있습니다. 또한 모델 평균이있는 경우 베이지안 방법이 더 강력 할 것입니다. 모형 선택을 사용하고 베이지안 예측을 동결하는 경우 빈도 예측을 사용하여 빈도 모델을 사용하는 것과 차이가 없습니다.
데이터를 교환 할 수 없어 테스트 및 유효성 검사 세트를 사용했습니다. 결과적으로 두 가지 문제를 해결해야했습니다. 첫 번째는 MCMC 방법의 번인과 유사합니다. 테스트 시퀀스를 시작하려면 매개 변수 추정치가 필요했기 때문에 50 년 전의 데이터를 사용하여 유효성 테스트를 시작하기위한 사전 밀도를 얻었습니다. 두 번째 문제는 테스트에 의문을 갖지 않기 위해 테스트를 위해 일정 기간의 표준화 된 기간이 필요하다는 것입니다. NBER이 발표 한 두 가지 이전 비즈니스주기를 사용했습니다.