«model-selection» 태그된 질문

모델 선택은 일부 세트에서 어떤 모델이 가장 잘 수행되는지 판단하는 문제입니다. 많이 사용되는 방법에는 , AIC 및 BIC 기준, 테스트 세트 및 교차 검증이 있습니다. 어느 정도 기능 선택은 모델 선택의 하위 문제입니다. R2


3
교차 검증을 사용할 때 하나의 표준 오류 규칙에 대한 경험적 근거
parsimony에 찬성하여 하나의 표준 오류 규칙의 사용을 정당화하는 경험적 연구가 있습니까? 분명히 그것은 데이터의 데이터 생성 프로세스에 달려 있지만, 대량의 데이터 세트를 분석하는 것은 매우 흥미로운 읽기 일 것입니다. "한 가지 표준 오류 규칙"은 교차 유효성 검사를 통해 (또는 일반적으로 임의 추출 기반 절차를 통해) 모델을 선택할 때 적용됩니다. 복잡성 …

1
중첩 교차 검증이 실제로 필요한 시점은 언제이며 실질적인 차이를 만들 수 있습니까?
교차 검증을 사용하여 모델 선택 (예 : 하이퍼 파라미터 튜닝)을 수행하고 최상의 모델의 성능을 평가하려면 중첩 교차 검증을 사용해야 합니다 . 외부 루프는 모델의 성능을 평가하는 것이고 내부 루프는 최상의 모델을 선택하는 것입니다. 모델은 각 외부 훈련 세트 (내부 CV 루프 사용)에서 선택되며 해당 성능은 해당 외부 시험 세트에서 측정됩니다. …

7
다중 선형 회귀 모형에 포함 할 변수 선택
현재 다중 선형 회귀를 사용하여 모델을 작성하려고합니다. 내 모델을 둘러 본 후에는 유지할 변수와 제거 할 변수를 가장 잘 결정하는 방법을 모르겠습니다. 내 모델은 DV에 대한 10 개의 예측 변수로 시작했습니다. 10 개의 예측 변수를 모두 사용할 때 4 개가 유의 한 것으로 간주되었습니다. 명백히 틀린 예측 변수 중 일부만 …

3
모델의 AIC (Akaike Information Criterion) 점수는 무엇을 의미합니까?
나는 평신도 용어의 의미에 대해 여기에 몇 가지 질문을 보았지만 이것들은 내 목적으로는 너무 평신도입니다. AIC 점수가 무엇을 의미하는지 수학적으로 이해하려고합니다. 그러나 동시에, 나는 더 중요한 요점을 보지 못하게하는 엄격한 증거를 원하지 않습니다. 예를 들어, 이것이 미적분학이라면, 나는 무한대에 만족할 것이고, 이것이 확률 이론이라면 측정 이론 없이도 행복 할 것입니다. …

2
모델 선택 및 교차 검증 : 올바른 방법
CrossValidated에는 모델 선택 및 교차 검증 주제에 대한 수많은 스레드가 있습니다. 몇 가지가 있습니다 : 내부 대 외부 교차 검증 및 모델 선택 DikranMarsupial의 @ 상단의 대답 에 기능 선택과 교차 검증 그러나 이러한 스레드에 대한 답변은 상당히 일반적이며 교차 검증 및 모델 선택에 대한 특정 접근 방식의 문제를 강조합니다. …



1
사후 예측 검사 란 무엇이고 무엇이 유용합니까?
나는 사후 예측 분포 가 무엇인지 이해하고 사후 예측 검사 에 대해 읽었 지만 아직 그것이 무엇인지는 분명하지 않습니다. 후방 예측 검사는 정확히 무엇입니까? 왜 일부 저자들은 사후 예측 검사를 실행하는 것이 "데이터를 두 번 사용하는"것이며 남용해서는 안된다고 말합니까? (또는 심지어 베이지안이 아님)? (예 : this 또는 this 참조 ) …

5
모델 선택의 AIC 지침
필자는 일반적으로 BIC를 AIC보다 parsimony를 더 중요하게 생각한다는 점을 이해하고 있습니다. 그러나 지금은보다 포괄적 인 접근 방식을 사용하기로 결정했으며 AIC도 사용하고 싶습니다. 나는 Raftery (1995)가 BIC 차이에 대한 훌륭한 지침을 제시했다는 것을 알고있다. 나는 교과서를 보았고 AIC에서 이상하게 보였습니다 (더 큰 차이는 약하고 AIC의 작은 차이는 하나의 모델이 더 좋습니다). …

6
파시 모니가 여전히 황금 표준이어야합니까?
그냥 생각 : Parsimonious 모델은 항상 모델 선택에서 기본으로 사용되었지만이 방법은 어느 정도 구식입니까? parsimony에 대한 우리의 경향이 abaci와 슬라이드 규칙의 시간 (또는 더 심각하지 않은 현대 컴퓨터)의 유물인지 궁금합니다. 오늘날의 컴퓨팅 성능을 통해 예측 능력이 더욱 강화 된 복잡한 모델을 구축 할 수 있습니다. 이러한 컴퓨팅 성능의 상한이 높아짐에 …

3
올가미 회귀 모델에 대한 AIC 및 BIC를 계산할 수 있습니까?
올가미 회귀 모형 및 매개 변수가 방정식에 부분적으로 만 입력되는 다른 정규화 된 모형에 대한 AIC 또는 BIC 값을 계산할 수 있습니까? 자유도를 어떻게 결정합니까? 패키지 의 glmnet()함수 에 올가미 회귀 모델을 맞추기 위해 R을 사용 glmnet하고 있으며 모델의 AIC 및 BIC 값을 계산하는 방법을 알고 싶습니다. 이런 식으로 정규화하지 …
31 r  model-selection  lasso  aic  bic 

1
교차 검증 오용 (최고 하이퍼 파라미터 값에 대한 성능보고)
최근 에는 특정 데이터 세트에서 k-NN 분류기를 사용하도록 제안하는 논문을 보았습니다 . 저자는 사용 가능한 모든 데이터 샘플을 사용하여 서로 다른 k 값 에 대해 k- 폴드 교차 검증을 수행 하고 최상의 하이퍼 파라미터 구성의 교차 검증 결과를보고했습니다. 내 지식으로는이 결과는 편향되어 있으며 하이퍼 파라미터 최적화를 수행하는 데 사용되지 않은 …

3
LASSO에 대한 인디케이터 / 바이너리 / 더미 예측 변수의 재조정 여부
LASSO (및 다른 모델 선택 절차)의 경우 예측 변수를 재조정하는 것이 중요합니다. 일반 추천 I 추적은 연속 변수의 0 평균, 1 개 표준 편차의 정상화를 사용하는 것입니다. 그러나 인형과 어떤 관련이 있습니까? 예를 들어 , 동일한 (우수한) 여름 학교의 일부 적용 예 는 연속 변수를 0과 1 사이로 조정하지만 (이상치에는 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.