«model-selection» 태그된 질문

모델 선택은 일부 세트에서 어떤 모델이 가장 잘 수행되는지 판단하는 문제입니다. 많이 사용되는 방법에는 , AIC 및 BIC 기준, 테스트 세트 및 교차 검증이 있습니다. 어느 정도 기능 선택은 모델 선택의 하위 문제입니다. R2

3
AIC를 최소화하여 모델을 선택하는 것이 언제 적절한가요?
적어도 일부 상위 칼리버의 통계 학자들 사이에서, 최소값의 특정 임계 값 내에 AIC 통계치가있는 모델은 AIC 통계를 최소화하는 모델로서 적절하게 고려되어야한다는 것이 잘 확립되어있다. 예를 들어 [1, p.221]에서 그런 다음 작은 GCV 또는 AIC 모델이 가장 좋습니다. 물론 GCV 또는 AIC를 맹목적으로 최소화해서는 안됩니다. 오히려 합리적으로 작은 GCV 또는 AIC …

1
PyMC3에서 베이지안 모델 선택
PyMC3을 사용하여 데이터에서 베이지안 모델을 실행하고 있습니다. 나는 Bayesian 모델링에 익숙하지 않지만 이 사이트의 일부 블로그 게시물 , Wikipedia 및 QA 에 따르면 Bayes factor 및 BIC 기준을 사용하여 내 데이터를 가장 잘 나타내는 모델을 선택할 수있는 유효한 접근 방법 인 것 같습니다 (생성하는 모델) 내 데이터). Bayes 계수를 계산하려면 …

1
과적 합 데이터없이 최적을 선택하는 방법은 무엇입니까? N 정규 함수 등을 사용하여 바이 모달 분포 모델링
나는 명백하게 이분법적인 가치 분포를 가지고 있는데, 나는 그것을 추구한다. 데이터는 2 개의 일반 기능 (바이 모달) 또는 3 개의 일반 기능에 잘 맞습니다. 또한 데이터를 3에 맞추는 데에는 그럴듯한 물리적 이유가 있습니다. 도입 된 매개 변수가 많을수록 충분한 상수를 사용하면 " 코끼리를 맞출 수있다"는 것처럼 완벽하게 맞을 수 있습니다 …

1
오프라인과 온라인 학습의 모델 선택
나는 최근 온라인 학습에 대해 더 많이 배우려고 노력했지만 (절대적으로 흥미 롭습니다!) 내가 잘 이해하지 못한 주제 중 하나는 오프라인과 온라인 컨텍스트에서 모델 선택에 대해 생각하는 방법입니다. 특히, 일부 고정 데이터 세트 에 따라 분류 자 오프라인으로 학습한다고 가정 합니다. 예를 들어, 교차 검증을 통해 성능 특성을 추정하고이 방법으로 가장 …

1
AIC 값이 낮고 대략 같을 때 어떻게해야합니까?
(1)에서 많은 책과 논문을 읽었던 Chris Chatfield는 다음과 같은 조언을합니다. 예를 들어, AIC 값이 낮거나 대략 동일한 ARIMA 시계열 모델 중에서 선택해야합니다. 이는 최소 AIC를 제공하는 것이 아니라 가장 최근 연도 데이터를 가장 잘 예측하는 것입니다. 그러한 조언의 근거는 무엇입니까? 소리가 좋은 경우, predict :: auto.arima 및 기타 예측 루틴이 …

5
공선 변수로 수행 할 작업
면책 조항 : 이것은 숙제 프로젝트입니다. 나는 여러 변수에 따라 다이아몬드 가격에 가장 적합한 모델을 만들려고 노력하고 있으며 지금까지 꽤 좋은 모델을 가지고있는 것 같습니다. 그러나 분명히 공선 인 두 가지 변수가 있습니다. >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 Depth -0.41035485 1.00000000 0.01779489 Carat.Weight 0.05237998 …

1
ABC 모델 선택
Bayes 계수를 사용한 ABC 모델 선택은 요약 통계 사용으로 인한 오류가 있으므로 권장되지 않는 것으로 나타 났습니다. 이 논문의 결론은 Bayes 계수 (알고리즘 2)를 근사화하기 위해 널리 사용되는 방법의 거동에 대한 연구에 의존합니다. 베이 즈 요인이 모델 선택을 수행하는 유일한 방법은 아니라는 것이 잘 알려져 있습니다. 모델의 예측 성능과 같이 …

2
중첩되지 않은 모델에 대한 일반화 된 로그 우도 비율 테스트
두 개의 모델 A와 B가 있고 A가 B에 중첩 된 경우 일부 데이터가 주어지면 MLE을 사용하여 A와 B의 매개 변수를 맞추고 일반 로그 우도 비 검정을 적용 할 수 있음을 이해합니다. 특히, 시험의 분포되어야 와 자유도 것으로 파라미터의 개수의 차이 및 있다.χ2χ2\chi^2nnnnnnAAABBB 그러나 와 의 매개 변수 수가 같지만 모델이 …

2
모델의 교차 검증 예측 오차 측면에서 순방향 선택 / 후진 제거에 비해 LASSO의 우수성
나는 원래의 풀 모델에서 앞으로 선택 뒤로 제거 L1 벌칙 기술 (LASSO) 순방향 선택 / 역방향 제거를 사용하여 얻은 모델의 경우, CVlm에서 DAAG제공되는 패키지를 사용 하여 교차 검증 된 예측 오차 추정치를 얻었 습니다 R. LASSO를 통해 선택된 모델에는을 사용했습니다 cv.glm. LASSO에 대한 예측 오차는 다른 것들에 대해 얻은 것보다 …

1
이 두 회귀 모형의 근본적인 차이점은 무엇입니까?
중요한 상관 관계가있는 이변 량 반응이 있다고 가정합니다. 이 결과를 모델링하는 두 가지 방법을 비교하려고합니다. 한 가지 방법은 두 결과 간의 차이를 모델링 할 수있다 : 또 다른 방법을 사용하는 것 또는 이를 모델링 : ( Y I의 J = β 0 + 시간 + X ' β )(yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) 다음은 …

3
이 큰 경우 중첩 이진 로지스틱 회귀 모델 비교
더 나은 내 질문을, 나는 16 변수 모델 (모두에서 출력의 일부를 제공 한 fit)과 17 변수 모델 ( fit2아래)을 (이러한 모델의 모든 예측 변수는이 모델 사이의 유일한 차이점은 그이고, 연속 fit하지 않습니다 변수 17 (var17) 포함) : fit Model Likelihood Discrimination Rank Discrim. Ratio Test Indexes Indexes Obs 102849 LR …

1
일반화 성능 분포 비교
분류 문제에 대해 두 가지 학습 방법 와 가 있으며 반복적 인 교차 유효성 검사 또는 부트 스트랩과 같은 일반화 성능을 추정한다고 가정하십시오. 이 과정에서 나는 이러한 반복에서 각 방법에 대한 점수 와 의 분포를 얻 (예 : 각 모델에 대한 ROC AUC 값의 분포).AAABBB PAPAP_APBPBP_B 이러한 분포를 보면 있지만 …

1
사전에 부적합한 베이 즈 요인
Bayes factor를 사용한 모델 비교에 관한 질문이 있습니다. 많은 경우, 통계학자는 부적절한 선행 (예 : 일부 Jeffreys 이전 및 참조 이전)과 함께 베이지안 접근법을 사용하는 데 관심이 있습니다. 내 질문은 모델 매개 변수의 사후 분포가 잘 정의 된 경우 부적절한 선행을 사용하여 베이 즈 요인을 사용하여 모델을 비교하는 것이 타당합니까? …



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.