«multicollinearity» 태그된 질문

예측 변수 사이에 강한 선형 관계가있는 상황에서 상관 관계 행렬이 (거의) 특이점이됩니다. 이 "불량 상태"는 각 예측 변수가 수행하는 고유 한 역할을 결정하기 어렵게합니다. 추정 문제가 발생하고 표준 오류가 증가합니다. 이변 적으로 매우 높은 상관 예측 변수는 다중 공선 성의 한 예입니다.

9
선형 회귀 분석에서 다중 공선 성이 문제인 이유에 대한 직관적 인 설명이 있습니까?
이 위키에서는 다중 공선 성 이 선형 회귀 문제 일 때 발생하는 문제에 대해 설명합니다 . 기본 문제는 다중 공선 성으로 인해 모수 추정값이 불안정하여 종속 변수에 대한 독립 변수의 영향을 평가하기가 매우 어렵다는 것입니다. 내가 문제 뒤에있는 기술적 인 이유를 이해 (반전 할 수 없습니다 , 악조건의 등) 그러나 …

9
중요한 F 통계량 (p <.001)이지만 중요하지 않은 회귀 분석 t- 검정을 얻는 이유는 무엇입니까?
다중 선형 회귀 분석에서 왜 유의 한 F 통계량 (p &lt;.001)을 가질 수 있지만 모든 회귀 분석에서 t- 값이 매우 높은가? 내 모델에는 10 개의 회귀자가 있습니다. 하나는 p- 값이 0.1이고 나머지는 0.9 이상입니다. 이 문제를 해결 하려면 다음 질문을 참조하십시오 .

1
행렬을 특이하게 만드는 상관 관계는 무엇이고 특이성 또는 특이성에 미치는 영향은 무엇입니까?
다른 행렬 (주로 로지스틱 회귀 분석)에서 일부 계산을 수행하고 있으며 일반적으로 "매트릭스가 단수입니다"라는 오류가 발생합니다. 여기서 돌아가서 상관 변수를 제거해야합니다. 내 질문은 "높은"상관 매트릭스를 무엇이라고 생각합니까? 이 단어를 나타내는 상관의 임계 값이 있습니까? 변수가 다른 변수와 상관 관계가 0.97 인 것처럼, 이것은 행렬을 특이하게 만들기에 충분한 "높음"입니까? 질문이 매우 기본적이라면 …

3
다중 회귀 모델에서 상관 예측 변수를 갖는 효과는 무엇입니까?
선형 모델 클래스에서 두 예측 변수가 서로 연관되어 있고 두 예측 변수가 모두 모형에 포함되면 하나는 중요하지 않다는 것을 알게되었습니다. 예를 들어, 집의 크기와 침실 수가 서로 연관되어 있다고 가정하십시오. 이 두 예측 변수를 사용하여 주택 비용을 예측할 때 둘 다 동일한 정보를 많이 제공하기 때문에 그 중 하나를 삭제할 …


2
임의 포리스트의 상관 관계가 높은 변수가 정확도와 기능 선택을 왜곡하지 않습니까?
내 이해에서, 상관 관계가 높은 변수는 임의 포리스트 모델에서 다중 공선 성 문제를 일으키지 않습니다 (잘못되면 수정하십시오). 그러나 다른 방법으로, 비슷한 정보를 포함하는 변수가 너무 많으면 다른 모델이 아닌이 세트에서 모델 가중치가 너무 커 집니까? 예를 들어, 동일한 예측 검정력을 가진 두 세트의 정보 (A, B)가 있습니다. 변수 , , …

3
어떤 분산 인플레이션 계수를 사용해야합니까 : 또는 ?
vifR 패키지 의 함수를 사용하여 분산 인플레이션 요인을 해석하려고 합니다 car. 이 함수는 일반화 된 및 합니다. 도움말 파일 에 따르면 이 후자의 값은GVIF 1 / ( 2 ⋅ df )VIFVIF\text{VIF}GVIF1 / ( 2 ⋅ df )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} 신뢰 타원체의 치수를 조정하기 위해이 함수는 GVIF ^ [1 / (2 * df)]도 …

3
변수 선택을 수행 할 때 다중 공선 성을 다루는 방법은 무엇입니까?
9 개의 연속 독립 변수가있는 데이터 세트가 있습니다. 모델을 단일 백분율 (종속) 변수에 맞추기 위해 이러한 변수 중에서 선택하려고합니다 Score. 불행히도, 나는 여러 변수 사이에 심각한 공선 성이 있음을 알고 있습니다. stepAIC()변수 선택을 위해 R 의 함수를 사용해 보았지만 그 방법은 변수가 방정식에 나열된 순서에 민감한 것 같습니다 ... 내 …

3
선형 회귀 모델과 비선형 회귀 모델의 차이점을 어떻게 알 수 있습니까?
비 선형 회귀 SAS Non Linear 에서 다음 링크를 읽었습니다 . 첫 번째 섹션 "Nonlinear Regression vs. Linear Regression"을 읽은 것을 이해하면 아래 방정식이 실제로 선형 회귀라는 것입니다. 맞습니까? 그렇다면 왜? y=b1x3+b2x2+b3x+cy=b1x3+b2x2+b3x+기음y = b_1x^3 + b_2x^2 + b_3x + c 비선형 회귀 분석에서 다중 공선 성이 문제가되지 않음을 이해하고 있습니까? …

2
교호 작용 항이 포함 된 경우에만 문제가되는 공선 성 진단
나는 미국 카운티에 대해 회귀 분석을 수행했으며 '독립적 인'변수에서 공선 성을 검사하고 있습니다. Belsley, Kuh 및 Welsch의 회귀 진단 에서는 조건 지수 및 분산 분해 비율을 살펴볼 것을 제안합니다. library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct …

5
혼합 선형 모델에서 다중 공선 성을 테스트하고 피하는 방법은 무엇입니까?
현재 혼합 효과 선형 모델을 사용하고 있습니다. R에서 "lme4"패키지를 사용하고 있습니다. 내 모델은 다음과 같은 형식을 취합니다. model &lt;- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) 모형을 실행하기 전에 예측 변수 간의 가능한 다중 공선 성을 확인했습니다. 나는 이것을함으로써 이것을했다 : 예측 변수의 데이터 프레임 만들기 dummy_df …

2
다중 공선 성에서 PCA가 불안정합니까?
회귀 상황에서 상관 관계가 높은 변수 세트가있는 경우 추정 계수의 불안정성으로 인해 일반적으로 "나쁜"것이라는 것을 알고 있습니다 (결정자는 0에 가까워짐에 따라 분산이 무한대로 진행됩니다). 내 질문은이 "나쁜 점"이 PCA 상황에서 지속되는지 여부입니다. 공분산 행렬이 특이 해짐에 따라 특정 PC의 계수 / 부하 / 무게 / 고유 벡터가 불안정하거나 임의 / …

6
상관 된 회귀 처리
상관 관계가 높은 회귀 분석을 사용한 다중 선형 회귀 분석에서 가장 적합한 전략은 무엇입니까? 상관 된 모든 회귀 변수를 곱하는 합법적 인 접근 방법입니까?

1
특정 다중 공선 성 척도를 선호하는 이유가 있습니까?
많은 입력 변수로 작업 할 때 종종 다중 공선 성이 중요 합니다. 다중 공선 성을 감지, 생각 및 / 또는 전달하는 데 사용되는 다중 공선 성 측정에는 여러 가지가 있습니다. 몇 가지 일반적인 권장 사항은 다음과 같습니다. 특정 변수에 대한 다중아르 자형2j아르 자형j2R^2_j 특정 변수에 대한 공차1 - R2j1−아르 자형j21-R^2_j …

1
다중 회귀 분석에서 예측 변수 간의 높은 상관 관계를 처리하는 방법은 무엇입니까?
다음과 같은 기사에서 참조를 찾았습니다. Tabachnick &amp; Fidell (1996)에 따르면 이변 량 상관 관계가 .70보다 큰 독립 변수는 다중 회귀 분석에 포함되지 않아야합니다. 문제 : 다중 회귀 설계에서 3 개의 변수 상관 관계인&gt; .80, VIF와 약 .2-.3, 공차 ~ 4-5를 사용했습니다. (중요 예측 변수 및 결과) 이들 중 어느 것도 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.