상관 관계가 높은 많은 종속 변수 (DV) (~ 450)를 예측하기 위해 축소 된 모델을 만들려고합니다.
내 독립 변수 (IV)도 많고 (~ 2000) 서로 관련이 있습니다.
올가미를 사용하여 각 출력에 대해 축소 된 모델을 개별적으로 선택하면 각 종속 변수를 반복 할 때 동일한 독립 변수 하위 집합을 얻을 수 없습니다.
R에서 올가미를 사용하는 다변량 선형 회귀가 있습니까?
이것은 올가미 그룹이 아닙니다. 올가미 그룹 IV. 나는 올가미를 구현하는 다변량 선형 회귀 (DV가 스칼라 벡터가 아닌 행렬임을 의미)를 원합니다. (참고 : NRH가 지적한 것처럼 이것은 사실이 아닙니다. 그룹 올가미는 IV를 그룹화하는 전략을 포함하지만 DV와 같은 다른 매개 변수를 그룹화하는 전략을 포함하는 일반적인 용어입니다)
나는이 논문이 Sparse Overlapping Sets Lasso 라고 불리는 것을 발견했다.
다변량 선형 회귀를 수행하는 코드는 다음과 같습니다.
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
다음은 단일 DV에서 올가미를 수행하는 코드입니다.
> fit = glmnet(dictionary, target[,1])
그리고 이것이 내가하고 싶은 일입니다.
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
한 번에 모든 대상에 맞는 기능 선택
glmnet
되고 철저한 비 네트가 있습니다.