LASSO 문제에 대한 계수를 얻고 싶습니다
문제는 glmnet과 lars 함수가 다른 답변을 제공한다는 것입니다. glmnet 함수의 경우 대신에 여전히 다른 답변을 얻습니다.λ
이것이 예상됩니까? lars 와 glmnet 의 관계는 무엇입니까 ? glmnet이 LASSO 문제에 더 빠르다는 것을 알고 있지만 어떤 방법이 더 강력한 지 알고 싶습니다.λ
deps_stats 데이터 세트의 크기가 너무 커서 LARS가이를 처리 할 수없는 반면 glmnet은 큰 데이터 세트를 처리 할 수 있습니다.
mpiktas (Y-Xb) ^ 2 + L \ sum | b_j |의 해를 찾고 싶습니다 그러나 특정 L에 대한 계산 된 계수에 대해 두 알고리즘 (lars & glmnet)에서 요청할 때 다른 대답을 얻습니다. 또는 두 기능에 대해 잘못된 람다를 사용하고 있습니다.
glmnet
으로도 LARS 구현에서도 단일 람다 솔루션을 요구해서는 안됩니다 . 바이어스와 분산의 스펙트럼에 따라 모든 범위의 솔루션을 제공합니다. 실제 계수를 비교하기가 어렵습니다. 그러나 여전히 동일한 변수는 비슷한 순서로 0이 아닌 값이어야합니다.