«multicollinearity» 태그된 질문

예측 변수 사이에 강한 선형 관계가있는 상황에서 상관 관계 행렬이 (거의) 특이점이됩니다. 이 "불량 상태"는 각 예측 변수가 수행하는 고유 한 역할을 결정하기 어렵게합니다. 추정 문제가 발생하고 표준 오류가 증가합니다. 이변 적으로 매우 높은 상관 예측 변수는 다중 공선 성의 한 예입니다.

5
독립 변수를 표준화하면 공선 성이 감소합니까?
Bayes / MCMC에 대한 좋은 글을 보았습니다. IT는 독립 변수를 표준화하면 MCMC (Metropolis) 알고리즘이 더 효율적일뿐만 아니라 (다중) 공선 성을 줄일 수 있다고 제안합니다. 사실일까요? 이것이 표준으로 해야 할 일입니까? (죄송합니다). Kruschke 2011, 베이지안 데이터 분석. (AP) 편집 : 예를 들어 > data(longley) > cor.test(longley$Unemployed, longley$Armed.Forces) Pearson's product-moment correlation data: …

1
선형 회귀 분석에서 독립 변수로 1을 합한 비율 해석
범주 형 변수 개념과 친숙성을 피하기 위해 한 수준을 기준선으로 맞출 수있는 각각의 더미 변수 코딩에 익숙합니다. 또한 이러한 모델의 모수 추정값을 해석하는 방법에 대해서도 잘 알고 있습니다. 기준선 범주를 기준으로 주어진 적합 수준의 범주 형 예측 변수에 대한 예상 결과 변화입니다. 내가 확실하지 않은 것은 1 에 비례하는 독립 …


2
분산-공분산 행렬 해석
선형 모델이 Model1있고 vcov(Model1)다음 행렬을 제공 한다고 가정하십시오 . (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 이 예제에서이 매트릭스는 실제로 무엇을 표시합니까? 모델과 독립적 변수에 대해 안전하게 어떤 가정을 할 수 있습니까?

1
다중 공선 성 및 스플라인 회귀에 문제가 있습니까?
자연적인 (즉, 제한된) 큐빅 스플라인을 사용할 때 생성 된 기본 함수는 매우 공 선형이며 회귀에 사용될 때 다중 공선 성을 나타내는 매우 높은 VIF (분산 인플레이션 계수) 통계를 생성하는 것으로 보입니다. 예측 목적으로 모델의 경우를 고려할 때 이것이 문제입니까? 스플라인 구조의 특성으로 인해 항상 그렇습니다. 다음은 R의 예입니다. library(caret) library(Hmisc) …

2
가장 밀접하게 연관된 예측 변수가 이진일 때 회귀 모델 구축을 시작하는 방법
I, 즉 세 개의 변수 (365)의 관찰을 포함하는 데이터 세트를 pm, temp그리고 rain. 이제 pm다른 두 변수의 변경에 대한 응답 으로 동작을 확인하고 싶습니다 . 내 변수는 다음과 같습니다 pm10 = 응답 (종속) temp = 예측 자 (독립) rain = 예측 자 (독립적) 다음은 내 데이터의 상관 관계 매트릭스입니다. > …

3
공선 성을 탐지하기위한 다양한 접근 방식의 장점은 무엇입니까?
OLS 회귀 분석에서 공선 성이 문제인지 확인하고 싶습니다. 분산 인플레이션 요인과 조건 지수는 일반적으로 사용되는 두 가지 측정 방법이지만 각 방법의 장점 또는 점수가 무엇인지에 대해 명확한 것을 찾는 것이 어렵다는 것을 알고 있습니다. 수행 할 접근 방식 및 / 또는 적절한 점수를 나타내는 중요한 출처가 매우 유용합니다. 비슷한 질문이 …

5
공선 변수로 수행 할 작업
면책 조항 : 이것은 숙제 프로젝트입니다. 나는 여러 변수에 따라 다이아몬드 가격에 가장 적합한 모델을 만들려고 노력하고 있으며 지금까지 꽤 좋은 모델을 가지고있는 것 같습니다. 그러나 분명히 공선 인 두 가지 변수가 있습니다. >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 Depth -0.41035485 1.00000000 0.01779489 Carat.Weight 0.05237998 …

2
범주 형 변수 간의 공선 성
연속 예측 변수와 관련하여 공선 성이 많지만 범주 형 예측 변수에서는 찾을 수 없습니다. 아래에이 유형의 데이터가 있습니다. 첫 번째 요인은 유전 적 변수 (대립 유전자 수)이고 두 번째 요인은 질병 범주입니다. 분명히 유전자가 질병보다 우선하며 진단으로 이어지는 증상을 나타내는 요인입니다. 그러나 SPSS와 관련하여 일반적으로 수행되는 II 또는 III 제곱합을 …

1
상관 관계가 거의없는 상관 관계가 높은 변수의 합과 차이에 대한 참조
종이에서 나는 내가 확률 변수 모델을 작성했습니다 와 보다는 와 효과적으로 할 때 발생하는 문제를 제거하는 와 높은 상관 관계하고 (그들은 내 응용 프로그램에있는 것처럼) 동일한 분산을 가지고 있습니다. 심판은 내가 참조를하기를 원한다. 쉽게 증명할 수는 있지만 응용 프로그램 저널은 간단한 수학 파생에 대한 참조를 선호합니다.X − Y X Y …


1
일반화 된 가산 모델에 대한 분산 팽창 계수
선형 회귀에 대한 일반적인 VIF 계산에서 각 독립 / 설명 변수 는 보통 최소 제곱 회귀 분석에서 종속 변수로 처리됩니다. 즉엑스제이엑스제이X_j 엑스제이= β0+ ∑i = 1 , i ≠ j엔β나는엑스나는엑스제이=β0+∑나는=1,나는≠제이엔β나는엑스나는 X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i 값이 각각 저장되는 회귀 및 VIF 의해 결정 n아르 자형2아르 …

3
다중 회귀 분석에서 설명 변수 간의 선형 관계
나는 R : 예제 기반 접근법을 사용하여 데이터 분석 및 그래픽 의 다중 회귀 장을 읽고 있었고 설명 변수 (산점도 사용) 사이의 선형 관계를 확인하는 것이 좋습니다. 그들이 그렇게 그들을 변환, 어떤 마에 않는 더 선형 적으로 관련된다. 이것에 대한 발췌문은 다음과 같습니다. 6.3 다중 회귀 모형 적합 전략 (...) …

2
범주 형 변수에 다중 공선 성이 내재되어 있습니까?
다변량 회귀 모델로 땜질을하는 동안 범주 형 변수 범주 내 에서 분산 인플레이션 계수로 측정 한 것처럼 작지만 눈에 띄는 다중 공선 효과가 있음을 알 수있었습니다 (물론 참조 범주 제외 후). 예를 들어, 연속 변수 y와 k가 가능한 배타적 값을 갖는 하나의 명목 범주 형 변수 x를 가진 데이터 세트가 …

3
다중 공선 성이 존재할 때 선형 회귀 계수의 통계적 유의성 결정
인구 규모가 다른 여러 도시가 있고 도시의 주류 판매점 수와 DUI 수 사이에 긍정적 인 선형 관계가 있는지 확인하고 싶다고 가정합니다. 추정 된 회귀 계수의 t- 검정을 기반으로이 관계가 유의한지 여부를 결정합니다. 이제 분명히 팝. 도시의 규모는 DUI의 수와 주류 판매점의 수와 양의 상관 관계가 있습니다. 따라서 주류 판매점에서 간단한 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.