«model-selection» 태그된 질문

모델 선택은 일부 세트에서 어떤 모델이 가장 잘 수행되는지 판단하는 문제입니다. 많이 사용되는 방법에는 , AIC 및 BIC 기준, 테스트 세트 및 교차 검증이 있습니다. 어느 정도 기능 선택은 모델 선택의 하위 문제입니다. R2

1
로그 연결 감마 GLM 대 로그 연결 가우시안 GLM 대 로그 변환 LM
내 결과에 따르면 GLM 감마가 대부분의 가정을 충족하는 것으로 보이지만 로그 변환 된 LM보다 가치있는 개선입니까? 내가 찾은 대부분의 문헌은 포아송 또는 이항 GLM과 관련이 있습니다. 나는 RANDOMIZATION을 사용한 일반 선형 모델 가정 평가의 기사가 매우 유용하다는 것을 알았지 만 결정을 내리는 데 사용 된 실제 도표는 부족하다. 다행히도 경험이있는 …

1
모델이 동일한 데이터 세트를 기반으로하는 한 AIC 값을 비교할 수 있습니까?
Rob Hyndman의 예측 패키지를 사용하여 R에서 일부 예측을 수행하고 있습니다 . 패키지에 포함 된 용지는 여기 에서 찾을 수 있습니다 . 이 논문에서 저자들은 자동 예측 알고리즘을 설명한 후 동일한 데이터 세트에서 알고리즘을 구현합니다. 그러나 지수 평활과 ARIMA 모델을 모두 추정 한 후에는 이해할 수없는 진술을합니다 (17 페이지). 정보 기준은 …

1
교호 작용 항과 고차 다항식
선형 설명 변수 와 종속 변수 와의 2 차 관계를 갖는 다른 설명 변수 사이의 양방향 상호 작용에 관심이 있다면 , 2 차 성분과의 상호 작용과 선형과의 상호 작용을 모두 포함해야합니다 모델의 구성 요소? 예 : 이전 스레드를 바탕으로 빌드 : 곡률 항 및 모델 선택 ( 이것이 R에서 사용하는 …

2
AIC와 BIC가 완전히 다른 모델을 선택할 수 있습니까?
1 개의 반응 변수와 6 개의 공변량으로 포아송 회귀 모델을 수행하고 있습니다. AIC를 사용하여 모형을 선택하면 모든 공변량 및 6 개의 교호 작용 항이있는 모형이 생성됩니다. 그러나 BIC는 공변량이 2 개이고 교호 작용 항이없는 모형이됩니다. 매우 유사한 두 가지 기준이 완전히 다른 모델 선택을 산출 할 수 있습니까?

1
변수 선택과 모델 선택
따라서 변수 선택은 모델 선택의 일부라는 것을 알고 있습니다. 그러나 모델 선택은 정확히 무엇으로 구성됩니까? 다음 이상입니다 : 1) 모형의 분포를 선택하십시오 2) 설명 변수를 선택하십시오. 나는 Burnham & Anderson : AIC vs BIC 기사를 읽고 모델 선택에서 AIC와 BIC에 대해 이야기 하기 때문에 이것을 묻습니다 . 내가 '변수 선택'과 …

1
베이지안 모델 선택의 Jeffreys-Lindley 역설에 대해 언제 걱정해야합니까?
RJMCMC를 사용하여 탐색하는 다양한 복잡성 모델의 넓은 (그러나 유한 한) 공간을 고려하고 있습니다. 각 모델의 매개 변수 벡터에 대한 사전 정보는 상당히 유익합니다. 더 복잡한 모델 중 하나가 더 적합 할 때 간단한 모델을 선호하는 Jeffreys-Lindley 역설 에 대해 어떤 경우에 걱정해야 합니까? 베이지안 모델 선택에서 역설의 문제를 강조하는 간단한 …

1
'가설 테스트'와 '모델 선택'의 차이점은 무엇입니까?
문헌에서 두 용어는 종종 동의어 또는 짜여져 사용됩니다. 나는 지금 두 용어 사이에 분명한 차이점을 찾으려고 노력하고 있습니다. 내 관점에서 가설은 일반적으로 모델을 통해 표현됩니다. 따라서 우리는 귀무 가설 대 대안 가설을 검정하더라도 내 관점에서 모델 선택을 수행합니다. 누군가이 차이점에 대해 직관적으로 설명 할 수 있습니까?

3
베이지안 대 MLE, 과적 합 문제
주교의 PRML 서적에서, 초과 적합은 MLE (Maximum Likelihood Estimation)의 문제이며 Bayesian은이를 피할 수 있다고 말합니다. 그러나 과적 합은 모수 추정에 사용 된 방법이 아니라 모형 선택에 대한 문제라고 생각합니다. 즉, 통해 생성되는 데이터 세트 가 있다고 가정 하면 이제 데이터에 맞게 다른 모델 를 선택 하고 알아낼 수 있습니다. 어느 …

1
중첩되지 않은 모델의 AIC : 정규화 상수
AIC는 . 여기서 는 최대 가능성 추정값이고 는 모수 공간의 차원입니다. 의 추정을 위해, 보통 밀도의 상수 인자를 무시합니다. 이것은 가능성을 단순화하기 위해 매개 변수에 의존하지 않는 요소입니다. 반면,이 요소는 중첩되지 않은 모델을 비교할 때이 요소가 일반적이지 않으며 해당 AIC의 순서가 고려되지 않으면 다를 수 있으므로 AIC 계산에 매우 중요합니다.AIC=−2log(L(θ^))+2pAIC=−2log⁡(L(θ^))+2pAIC=-2 …

4
AIC (또는 BIC)를 사용한 PCA 모델 선택
AKA (Akaike Information Criterion)를 사용하여 PCA에서 추출 할 적절한 수의 요소를 선택하고 싶습니다. 유일한 문제는 매개 변수 수를 결정하는 방법을 잘 모르겠다는 것입니다. 행렬 고려하십시오. 여기서 은 변수 수를 나타내고 는 관측치 수를 나타냅니다. 예를 들어 입니다. 공분산 행렬이 대칭이므로 의 최대 우도 추정값은 AIC의 매개 변수 수를 동일하게 설정할 …

1
R-자유도에서 PROC Mixed과 lme / lmer의 차이점
참고 :이 질문은 법적 이유로 인해 이전 질문을 삭제해야했기 때문에 다시 게시되었습니다. SAS의 PROC MIXED를 R lme의 nlme패키지 기능과 비교하는 동안 다소 혼란스러운 차이점을 발견했습니다. 구체적으로는, 다른 시험에서 자유도간에 상이 PROC MIXED하고 lme, 그리고 왜 생각해. 다음 데이터 세트에서 시작하십시오 (아래 제공된 R 코드). ind : 측정 대상을 나타내는 계수 …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
주성분 분석을 사용하여 회귀 변수를 선택하는 방법은 무엇입니까?
현재 주성분 분석을 사용하여 모델링에 사용할 변수를 선택하고 있습니다. 현재 실험에서 A, B 및 C를 측정합니다. 정말로 알고 싶은 것은 : 시간과 노력을 절약하기 위해 더 적은 측정을하고 C 및 / 또는 B 기록을 중단 할 수 있습니까? 내 데이터의 분산의 60 %를 차지하는 첫 번째 주요 구성 요소에 3 …


2
모델 선택 또는 정규화 후 GLM
이 질문을 두 부분으로 나누고 싶습니다. 둘 다 일반 선형 모델을 다루지 만, 첫 번째는 모델 선택을 다루고 다른 하나는 정규화를 다룹니다. 배경 : 나는 예측과 설명을 위해 GLM (선형, 로지스틱, 감마 회귀) 모델을 사용합니다. " 회귀로하는 정상적인 일 "을 언급 할 때, 나는 주로 (i) 계수에 대한 신뢰 구간, …

1
Fisher의 정확한 테스트 및 초기 하 분포
피셔의 정확한 테스트를 더 잘 이해하고 싶기 때문에 f와 m이 남성과 여성에 해당하고 n과 y가 "소다 소비"에 해당하는 다음 장난감 예제를 고안했습니다. > soda_gender f m n 0 5 y 5 0 분명히 이것은 과감한 단순화이지만 컨텍스트가 방해되는 것을 원하지 않았습니다. 여기서 나는 남자들이 음료수를 마시지 않고 여자들은 음료수를 마시고 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.