«model-selection» 태그된 질문

모델 선택은 일부 세트에서 어떤 모델이 가장 잘 수행되는지 판단하는 문제입니다. 많이 사용되는 방법에는 , AIC 및 BIC 기준, 테스트 세트 및 교차 검증이 있습니다. 어느 정도 기능 선택은 모델 선택의 하위 문제입니다. R2

2
부트 스트랩 리샘플링에 가장 권장되는 교과서?
나는 단지 당신의 견해로는 부트 스트랩에 대한 최고의 책을 묻고 싶었습니다. 이것으로 반드시 개발자가 작성한 것을 의미하지는 않습니다. 다음 기준을 충족하는 부트 스트랩에 가장 적합한 교과서를 표시 할 수 있습니까? 적용 가능성, 강점 및 약점, 모델 선택의 중요성을 기술하는 기술에 대한 철학적 / 인식 론적 근거? 구현, 철학적 토대, 바람직하게는 …

1
멀티 모델 추론에 대한 Burnham-Anderson 책을 추천 할 수 있습니까?
R의 예측 패키지에서 AIC에서 AICc 로의 기본 모델 선택 통계의 최근 변경에 의해 동기가 부여 된 것처럼, 나는 후자가 실제로 어디에서나 적용 가능한지 궁금합니다. 이 점에 대한 일련의 질문이 있으며 여기에 첫 번째 질문이 있습니다. 나는 (1) 에서 번햄과 앤더슨 (비 통계 학자)이 여기 에서 요약 한 바와 같이 잘 …

2
단계적 회귀는 모집단 r- 제곱의 편향 추정치를 제공합니까?
심리학 및 기타 분야에서 다음과 같은 단계적 회귀 형태가 종종 사용됩니다. 나머지 예측 변수를보고 (처음에는 모형에 없음) 가장 큰 r- 제곱 변화를 초래하는 예측 변수를 식별하십시오. r- 제곱 변화의 p- 값이 알파보다 작 으면 (일반적으로 .05) 해당 예측 변수를 포함시키고 1 단계로 돌아가십시오. 그렇지 않으면 중지하십시오. 예를 들어, SPSS 에서이 …

5
AIC를 사용하여 모델 선택을 적용하면 변수에 중요하지 않은 p- 값이 제공되는 이유
AIC에 대해 궁금한 점이 있으시면 도와 드리겠습니다. 데이터에 AIC를 기반으로 모델 선택 (뒤로 또는 앞으로)을 적용했습니다. 그리고 선택된 변수 중 일부는 p- 값> 0.05로 끝났습니다. 사람들은 p- 값 대신 AIC를 기반으로 모델을 선택해야한다고 말하고 있기 때문에 AIC와 p- 값은 두 가지 차이점 개념 인 것 같습니다. 누군가 차이점이 무엇인지 말해 …

2
박스 젠킨스 모델 선택
시계열 분석에서 Box-Jenkins 모델 선택 절차는 시리즈의 자기 상관 및 부분 자기 상관 함수를 살펴 보는 것으로 시작합니다. 이러한 도표 는 ARMA 모델 에서 적절한 ppp 및 를 제안 할 수 있습니다 . 이 절차는 사용자에게 AIC / BIC 기준을 적용하여 화이트 노이즈 오류 항이있는 모델을 생성하는 모델 중에서 가장 …

1
AIC를 기준으로 모델을 비교하는 방법은 무엇입니까?
우리는 로그 우도를 계산하기 위해 동일한 방법을 사용하는 두 가지 모델을 가지고 있으며 하나의 AIC는 다른 것보다 낮습니다. 그러나 AIC가 낮은 것은 해석하기가 훨씬 어렵습니다. 어려움을 도입 할 가치가 있는지 판단하는 데 어려움을 겪고 있으며 AIC의 백분율 차이를 사용하여이를 판단했습니다. 우리는 두 AIC 사이의 차이가 0.7 %에 불과하다는 것을 발견했으며, …

4
다변량 회귀 전의 일 변량 회귀 점은 무엇입니까?
나는 현재 우리가 작은 데이터 세트를 가지고 있고 결과에 대한 치료의 인과 관계 영향에 관심이있는 문제에 대해 연구하고 있습니다. 고문은 각 예측 변수에 대해 일 변량 회귀 분석을 수행하고 결과를 반응으로, 처리 할당을 반응으로 수행하도록 지시했습니다. 즉, 한 번에 하나의 변수로 회귀를 맞추고 결과 테이블을 만들어야합니다. 나는 "우리가 왜 이것을해야합니까?"라고 …

2
변수 선택에 대한 충돌 접근법 : AIC, p- 값 또는 둘 다?
내가 이해 한 바에 따르면, p- 값을 기반으로 한 변수 선택 (적어도 회귀 컨텍스트에서)에는 결함이 있습니다. AIC (또는 유사한)를 기반으로 한 변수 선택도 비슷한 이유로 약간의 결함으로 간주됩니다. 비록 이것이 다소 불분명 한 것처럼 보이지만 (예를 들어 내 질문 과이 주제에 대한 일부 링크를 참조하십시오 : "단계적 모델 선택"은 정확히 …

2
선형 대 비선형 회귀
이론적으로 지수 적으로 관련된 및 값 세트가 있습니다 .y엑스xx와이yy 와이= X비y=axby = ax^b 계수를 구하는 한 가지 방법은 양쪽에 자연 로그를 적용하고 선형 모형을 피팅하는 것입니다. > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] 이것을 얻는 또 다른 방법은 이론적 인 시작 값 세트가 주어지면 비선형 …

2
청크 테스트 란 무엇입니까?
에 대한 질문에 대한 대답에서 다중 공선의 존재 모델 선택 , 프랭크 하렐은 제안 : 모든 변수를 모형에 넣지 만 경쟁 변수의 효과에 대해 조정 된 하나의 변수의 효과에 대해서는 테스트하지 않습니다 ... 경쟁 변수의 청크 테스트는 공선 변수가 전체 다중 자유도 연관 검정 대신 힘을 결합하기 때문에 강력합니다. 변수를 …

2
검증 및 모델 선택을위한 부트 스트랩 이해
부트 스트랩 의 기본 원리가 어떻게 작동하는지 이해하고 있지만 모델 선택에 부트 스트랩을 사용하거나 과적 합을 피하는 방법을 잘 모르겠습니다. 예를 들어, 모델 선택의 경우 부트 스트랩 샘플에서 가장 낮은 오차 (아마도 편차)를 산출하는 모델을 선택 하시겠습니까? 모델 선택 또는 검증에 부트 스트랩을 사용하는 방법에 대해 설명하는 텍스트가 있습니까? 편집 …

2
AIC 및 Schwarz 기준 이해
물류 모델을 실행 중입니다. 실제 모델 데이터 세트에는 100 개 이상의 변수가 있지만 약 25 개의 변수가있는 테스트 데이터 세트를 선택하고 있습니다. 그 전에 8-9 변수가있는 데이터 세트를 만들었습니다. AIC 및 SC 값을 사용하여 모델을 비교할 수 있다고 들었습니다. 변수의 p 값이 낮더라도 (예 : 0053) 모델의 SC 값이 더 …

3
정보 지오메트리를 사용하여 거리와 부피를 정의하는 것… 유용합니까?
저는 확률 분포 공간에서 Fisher의 정보 지표를 자연 지역 지표로 사용하고이를 통합하여 거리와 부피를 정의하는 것을 옹호 하는 많은 문헌을 발견했습니다. 그러나 이러한 "통합 된"수량이 실제로 무엇에 유용합니까? 나는 이론적 인 정당화와 실제 적용이 거의 없음을 발견했다. 하나는 가이 레바논의 작품 으로 "피셔 거리"를 사용하여 문서를 분류하고 다른 하나는 로드리게스 …

2
단계적 회귀를 사용해야하는 상황이 있습니까?
과거에 많은 생물 의학 논문에서 단계적 회귀가 과도하게 사용되었지만 많은 문제에 대한 더 나은 교육으로 개선되고있는 것으로 보입니다. 그러나 많은 오래된 검토 자들은 여전히 ​​그것을 요구합니다. 단계적 회귀는 역할을하고 상황은 무엇입니까 해야합니다 (있는 경우)를 사용할 수는?

1
LLE (local linear embedding) 알고리즘의 단계를 설명 하시겠습니까?
LLE 알고리즘의 기본 원리는 세 단계로 구성되어 있습니다. k-nn과 같은 메트릭으로 각 데이터 포인트의 주변을 찾습니다. 이웃이 데이터 포인트에 미치는 영향을 나타내는 각 이웃에 대한 가중치를 찾으십시오. 계산 된 가중치를 기반으로 데이터의 저 차원 임베딩을 구성하십시오. 그러나 2 단계와 3 단계에 대한 수학적 설명은 내가 읽은 모든 교과서와 온라인 자료에서 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.