«model-selection» 태그된 질문

모델 선택은 일부 세트에서 어떤 모델이 가장 잘 수행되는지 판단하는 문제입니다. 많이 사용되는 방법에는 , AIC 및 BIC 기준, 테스트 세트 및 교차 검증이 있습니다. 어느 정도 기능 선택은 모델 선택의 하위 문제입니다. R2

1
모형에서 항을 제거한 후 적절한 잔차 자유도
저는 이 질문 에 대한 토론 과 특히 축소 된 모형 (예 : 여러 설명 변수가 테스트되고 거부 된 모형)의 분산 추정치는 Ye의 일반화 된 자유도를 사용해야한다는 Frank Harrell의 의견을 반영하고 있습니다 . Harrell 교수는 이것이 최종 모델 (여러 변수가 기각 된)의 모델보다 원래의 "풀"모델 (모든 변수가 포함 된)의 잔류 …

3
AIC가 다른 유형의 모델을 비교할 수 있습니까?
R에서 비선형 모델을 비교하기 위해 AIC (Akaike 's Information Criterion)를 사용하고 있습니다. 다른 유형의 모델의 AIC를 비교하는 것이 유효합니까? 구체적으로, glm에 맞는 모델과 glmer (lme4)에 맞는 랜덤 효과 항이있는 모델을 비교하고 있습니다. 그렇지 않은 경우 그러한 비교를 수행 할 수있는 방법이 있습니까? 아니면 아이디어가 완전히 유효하지 않습니까?

4
CART를 사용할 때 '가변 중요성'을 측정 / 순위 지정하는 방법은 무엇입니까? (특히 R의 {rpart}를 사용하여)
rpart (R)를 사용하여 CART 모델 (특히 분류 트리)을 작성할 때 모델에 도입 된 다양한 변수의 중요성을 아는 것이 종종 흥미 롭습니다. 따라서 제 질문은 CART 모델에 참여하는 변수의 변수 중요도를 평가 / 측정하기 위해 어떤 일반적인 측정이 있습니까? R을 사용하여 어떻게 계산할 수 있습니까 (예 : rpart 패키지를 사용하는 경우) …

3
AIC 모델 비교를위한 전제 조건
AIC 모델 비교가 작동하려면 정확히 필요한 전제 조건은 무엇입니까? 다음과 같이 비교했을 때이 질문을 방금했습니다. > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] 14277.29 이 방법 log으로 variable 의 변환을 정당화했습니다 usili. 그러나 종속 변수가 다른 경우 모델을 AIC …

4
모델 불확실성 해결
CrossValidated 커뮤니티의 베이지안이 어떻게 모델 불확실성 의 문제를보고 어떻게 다루고 싶어 하는지 궁금 했습니다. 나는 두 부분으로 내 질문을 제기하려고 노력할 것이다. (경험 / 의견에서) 모델 불확실성을 다루는 것이 얼마나 중요합니까? 기계 학습 커뮤니티 에서이 문제에 관한 논문을 찾지 못했습니다. 그 이유가 궁금합니다. 모델 불확실성을 처리하는 일반적인 방법은 무엇입니까 (참조를 …

5
혼합 모형에서 요인을 랜덤으로 처리하는 것의 장점은 무엇입니까?
몇 가지 이유로 모델 요소를 무작위로 레이블링하는 이점을 수용하는 데 문제가 있습니다. 나에게 거의 모든 경우에서 최적의 해결책은 모든 요소를 ​​고정 된 것으로 취급하는 것 같습니다. 첫째, 고정 대 무작위의 구별은 임의적입니다. 표준 설명은 특정 실험 단위 자체에 관심이 있다면 고정 효과를 사용해야하고, 실험 단위로 표현 된 모집단에 관심이 있다면 …

4
이러한 분석 기술에 대한 글로벌 비전이 있습니까?
나는 현재 우리 모두처럼 출력 가 입력 와 어떻게 관련되어 있는지 이해하기 위해 기본적으로 필요한 프로젝트에 있습니다. 여기서의 특이점은 데이터 가 한 번에 하나씩 제공되므로 새로운 받을 때마다 분석을 업데이트하고 싶습니다 . 필자는 필요한 모든 데이터를 보유하고 동시에 모든 데이터를 사용하여 계산을 수행하는 "배치"처리와 달리 "온라인"처리라고합니다.yyyxxx(y,x)(y,x)(y,x)(y,x)(y,x)(y,x) 그래서 나는 아이디어를 둘러 …

2
주제 모델의 주제 안정성
일련의 개방형 에세이의 내용에 대한 정보를 추출하려는 프로젝트를 진행 중입니다. 이 특정 프로젝트에서 148 명이 더 큰 실험의 일환으로 가상의 학생 조직에 대한 에세이를 썼습니다. 내 분야 (사회 심리학)에서 이러한 데이터를 분석하는 일반적인 방법은 수필로 수필을 코딩하는 것이지만 수작업으로 코딩하는 것은 노동 집약적이며 너무 주관적이기 때문에 정량적으로 수행하고 싶습니다. 미각. …

3
시계열에서의 AIC와 교차 검증 : 작은 샘플 사례
시계열 설정에서 모델 선택에 관심이 있습니다. 구체적으로 지연 순서가 다른 ARMA 모델 풀에서 ARMA 모델을 선택한다고 가정합니다. 궁극적 인 의도는 예측 입니다. 모델 선택은 교차 검증, 정보 기준 (AIC, BIC) 사용 다른 방법들 중에서도 Rob J. Hyndman은 시계열에 대해 교차 검증 을 수행하는 방법을 제공합니다 . 비교적 작은 샘플의 경우, …

2
왜 윌크스의 1938 증거가 잘못 지정된 모델에 대해 작동하지 않습니까?
유명한 1938 년 논문 ( " 복합 가설 테스트를위한 가능성 비율의 대규모 표본 분포 ", Annals of Mathematical Statistics, 9 : 60-62)에서 Samuel Wilks는 (로그 가능성 비율) 의 점근 분포를 도출했습니다. 더 큰 가설이 올바르게 지정되었다는 가정하에 내포 된 가설의 경우 제한 분포는 자유도를 갖는 (chi-squared)이며 , 여기서 는 더 …

1
적절한 채점 규칙 중에서 선택
적절한 점수 규칙에 대한 대부분의 리소스에는 로그 손실, 브리 어 점수 또는 구면 점수와 같은 여러 가지 점수 규칙이 언급되어 있습니다. 그러나 그들은 종종 그들 사이의 차이점에 대해 많은 지침을 제공하지 않습니다. (A 전시회 : Wikipedia ) 로그 점수를 최대화하는 모델을 선택하는 것은 최대 가능성 모델을 선택하는 것과 일치하며, 이는 …

3
소개 : 고전적인 "큰 p, 작은 n 문제"의 데이터 집합이 있습니다. 사용 가능한 샘플 수는 n = 150이고 가능한 예측 변수 수는 p = 400입니다. 결과는 연속 변수입니다. 가장 중요한 "설명자", 즉 결과를 설명하고 이론을 세우는 데 가장 적합한 후보자를 찾고 싶습니다. 이 주제에 대한 연구 후 LASSO와 Elastic Net이 …

2
모델 선택 베이지안 또는 교차 검증에 가장 적합한 방법은 무엇입니까?
다양한 모델 또는 포함 할 기능의 수를 선택하려고 할 때 예측이라고하면 두 가지 접근법을 생각할 수 있습니다. 데이터를 학습 및 테스트 세트로 분할하십시오. 더 나은 방법은 부트 스트랩 또는 k- 폴드 교차 검증을 사용하는 것입니다. 매번 훈련 세트를 훈련시키고 테스트 세트에 대한 오차를 계산하십시오. 테스트 오류 대 매개 변수 수를 …


3
AIC 또는 p- 값 : 모델 선택을 위해 어떤 것을 선택해야합니까?
나는이 R 일에 익숙하지 않지만 어떤 모델을 선택 해야할지 확실하지 않습니다. 가장 낮은 AIC를 기반으로 각 변수를 선택 하는 단계적 회귀 분석 을 수행했습니다. 나는 어느 것이 "최고"인지 확신 할 수없는 3 가지 모델을 생각 해냈다. Model 1: Var1 (p=0.03) AIC=14.978 Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.