«stepwise-regression» 태그된 질문

단계적 회귀 (종종 정방향 또는 역방향 회귀라고 함)에는 회귀 모델을 맞추고 다음을 기반으로 예측 변수를 추가하거나 제거하는 작업이 포함됩니다. 통계, 아르 자형2또는 최종 모델에 * 단계적으로 * 도달하기위한 정보 기준. 이 태그는 정방향 선택, 역방향 제거 및 최적의 하위 집합 변수 선택 전략에도 사용할 수 있습니다.

8
자동 모델 선택을위한 알고리즘
자동 모델 선택을위한 알고리즘을 구현하고 싶습니다. 나는 단계적 회귀를 할 생각이지만 아무것도 할 것입니다 (선형 회귀를 기반으로해야합니다). 내 문제는 방법론이나 오픈 소스 구현을 찾을 수 없다는 것입니다 (Java에서 깨우고 있습니다). 내가 생각하는 방법은 다음과 같습니다. 모든 요인의 상관 행렬을 계산 서로 관련성이 낮은 요소를 선택하십시오 t-stat가 낮은 요인 제거 다른 …

5
단계별 회귀에 대한 현대적이고 쉽게 사용되는 대안은 무엇입니까?
약 30 개의 독립 변수가있는 데이터 세트가 있으며 GLM (Generalized Linear Model)을 구성하여 변수와 종속 변수 간의 관계를 탐색하려고합니다. 나는이 상황에 대해 배운 방법, 단계적 회귀가 이제 통계적 죄로 간주된다는 것을 알고 있습니다. 이 상황에서 어떤 현대적인 모델 선택 방법을 사용해야합니까?

5
많은 독립 변수에서 유의 한 예측 변수 탐지
겹치지 않는 두 인구 (환자 및 건강, 총 ) 의 데이터 세트 에서 연속 종속 변수에 대한 중요한 예측 변수 ( 독립 변수 중) 를 찾고 싶습니다 . 예측 변수 사이의 상관 관계가 있습니다. 나는 예측 변수 중 어느 것이 종속 변수를 가능한 정확하게 예측하기보다는 "실제로"종속 변수와 관련이 있는지 알아내는 …

2
단계적 선택을 수행 한 후 p- 값이 잘못된 이유는 무엇입니까?
예를 들어 선형 회귀 모델을 생각해 봅시다. 데이터 마이닝에서 AIC 기준을 기반으로 단계별 선택을 수행 한 후 각 실제 회귀 계수가 0이라는 귀무 가설을 테스트하기 위해 p- 값을 보는 것이 잘못되었다고 들었습니다. 모델에 남아있는 모든 변수를 0과 다른 실제 회귀 계수로 간주해야한다고 들었습니다. 아무도 왜 나에게 설명 할 수 있습니까? …

3
AIC 또는 p- 값 : 모델 선택을 위해 어떤 것을 선택해야합니까?
나는이 R 일에 익숙하지 않지만 어떤 모델을 선택 해야할지 확실하지 않습니다. 가장 낮은 AIC를 기반으로 각 변수를 선택 하는 단계적 회귀 분석 을 수행했습니다. 나는 어느 것이 "최고"인지 확신 할 수없는 3 가지 모델을 생각 해냈다. Model 1: Var1 (p=0.03) AIC=14.978 Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = …

1
단계적 회귀를 사용하여 발생하는 짖는 짐승
회귀 모형에서 단계적 / 앞으로 / 뒤로 선택의 문제점을 잘 알고 있습니다. 방법을 비난하고 더 나은 대안을 제시하는 연구자들이 많이 있습니다. 통계 분석에 존재하는 이야기가 있는지 궁금합니다. 단계적 회귀를 사용했습니다. 최종 모델을 기반으로 중요한 결론을 내 렸습니다. 결론이 잘못되어 개인, 연구 또는 조직에 부정적인 결과를 초래 함 단계적인 방법이 나쁘면 …

2
불이익 회귀 모형으로부터 R- 제곱 및 통계적 유의성 추정
나는 R 패키지를 사용하고 범 나는 사람이 중요하다있는 예측과 약간의 지식을 많이 가지고 어디에 데이터 집합에 대한 계수의 수축 추정치를 얻을 수 있습니다. 튜닝 매개 변수 L1 및 L2를 선택하고 계수에 만족 한 후 R- 제곱과 같은 모형 적합도를 통계적으로 알 수있는 방법이 있습니까? 또한, 모델의 전체적인 의미를 테스트하는 데 …

2
LASSO는 단계적 회귀와 같은 문제로 고통 받습니까?
단계적 알고리즘 변수 선택 방법은 회귀 모델 ( ββ\beta 및 SE, p- 값 , F 통계 등)의 모든 추정치에 다소 차이가있는 모형에 대해 선택하는 경향이 있으며 다음과 같이 실제 예측 변수를 배제 할 가능성이 높습니다. 합리적으로 성숙한 시뮬레이션 문헌에 따른 거짓 예측 자. 변수를 선택하는 데 LASSO가 동일한 특정 방식으로 …

1
Stepwise AIC-이 주제와 관련하여 논란이 있습니까?
이 사이트에서 p- 값 기반, AIC, BIC 등 모든 종류의 기준을 사용하여 단계별로 변수를 선택하는 것에 대해 믿을 수 없을 정도로 많은 게시물을 읽었습니다. 이러한 절차가 일반적으로 변수 선택에있어 왜 좋지 않은지 이해합니다. 궁의 아마 유명한 포스트는 여기에 명확하게 이유를 설명; 궁극적으로 우리는 단지 데이터 준설이라는 가설을 제시 할 때 …

2
LASSO / LARS 및 일반 대 특정 (GETS) 방법
왜 LASSO 및 LARS 모델 선택 방법이 기본적으로 단계별 순방향 선택의 변형이지만 경로 의존성을 겪을지라도 왜 그렇게 인기가 있는지 궁금합니다. 마찬가지로, 단계 선택 회귀 문제를 겪지 않기 때문에 LARS / LASSO보다 더 나은 모델 선택을위한 GETS (General to Specific) 방법이 왜 대부분 무시 되는가? (GETS에 대한 기본 참조 : http://www.federalreserve.gov/pubs/ifdp/2005/838/ifdp838.pdf- …

2
단계적 회귀는 모집단 r- 제곱의 편향 추정치를 제공합니까?
심리학 및 기타 분야에서 다음과 같은 단계적 회귀 형태가 종종 사용됩니다. 나머지 예측 변수를보고 (처음에는 모형에 없음) 가장 큰 r- 제곱 변화를 초래하는 예측 변수를 식별하십시오. r- 제곱 변화의 p- 값이 알파보다 작 으면 (일반적으로 .05) 해당 예측 변수를 포함시키고 1 단계로 돌아가십시오. 그렇지 않으면 중지하십시오. 예를 들어, SPSS 에서이 …

2
Sane 단계적 회귀?
이진 분류기를 만들고 싶다고 가정 해보십시오. 수천 가지 기능과 몇 가지 샘플 만 있습니다. 도메인 지식에서, 나는 클래스 레이블이 정확하게 몇 기능을 사용하여 예측 될 수 있다고 생각하는 좋은 이유를 가지고,하지만 난 아무 생각이 없다 하는 것들. 또한 최종 결정 규칙을 쉽게 해석 / 설명하고 소수의 기능을 추가로 필요로하기를 원합니다. …

2
R에서 drop1 출력 해석
R에서 drop1명령은 깔끔한 것을 출력합니다. 이 두 명령은 약간의 출력을 가져옵니다. example(step)#-> swiss drop1(lm1, test="F") 광산은 다음과 같습니다. > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC F value Pr(F) <none> 2105.0 190.69 Agriculture 1 …

5
단계적 로지스틱 회귀 및 샘플링
SPSS의 데이터 집합에 대해 단계별 로지스틱 회귀 분석을 적용하고 있습니다. 이 절차에서는 모델을 대략 임의의 하위 집합에 맞 춥니 다. 전체 표본의 60 %, 약 330 건입니다. 내가 흥미로운 점은 데이터를 다시 샘플링 할 때마다 최종 모델에서 다른 변수가 나타나고 나오는 것입니다. 최종 모형에는 항상 소수의 예측 변수가 있지만 표본에 …

2
단계적 회귀를 사용해야하는 상황이 있습니까?
과거에 많은 생물 의학 논문에서 단계적 회귀가 과도하게 사용되었지만 많은 문제에 대한 더 나은 교육으로 개선되고있는 것으로 보입니다. 그러나 많은 오래된 검토 자들은 여전히 ​​그것을 요구합니다. 단계적 회귀는 역할을하고 상황은 무엇입니까 해야합니다 (있는 경우)를 사용할 수는?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.