나는 R 패키지를 사용하고 범 나는 사람이 중요하다있는 예측과 약간의 지식을 많이 가지고 어디에 데이터 집합에 대한 계수의 수축 추정치를 얻을 수 있습니다. 튜닝 매개 변수 L1 및 L2를 선택하고 계수에 만족 한 후 R- 제곱과 같은 모형 적합도를 통계적으로 알 수있는 방법이 있습니까?
또한, 모델의 전체적인 의미를 테스트하는 데 관심이 있습니다 (즉, R² = 0 또는 모두 = 0).
나는 여기 에서 비슷한 질문에 대한 답변을 읽었 지만 내 질문에 대답하지 못했습니다. 이 내가 사용하는 R 패키지에 훌륭한 튜토리얼의 여기가 , 그리고 저자 Jelle Goeman는 범 회귀 모델에서 신뢰 구간에 대한 튜토리얼의 마지막에 다음과 같은 메모를했다 :
회귀 계수 또는 기타 추정 수량의 표준 오차를 요청하는 것은 매우 자연스러운 질문입니다. 원칙적으로 이러한 표준 오차는 예를 들어 부트 스트랩을 사용하여 쉽게 계산할 수 있습니다.
그러나이 패키지는 일부러 제공하지 않습니다. 그 이유는 불이익을받는 추정 방법에서 발생하는 것과 같이 강하게 치우친 추정에는 표준 오차가 그다지 의미가 없기 때문입니다. 불이익 추정은 상당한 편향을 도입하여 추정기의 분산을 줄이는 절차입니다. 따라서 각 추정기의 치우침은 평균 제곱 오차의 주요 구성 요소 인 반면, 분산은 작은 부분에만 영향을 줄 수 있습니다.
불행히도, 대부분의 처벌 회귀 적용에서는 충분히 정확한 바이어스 추정치를 얻는 것이 불가능합니다. 부트 스트랩 기반 계산은 추정값의 분산 만 평가할 수 있습니다. 신뢰할 수있는 편견없는 추정값을 사용할 수있는 경우에만 바이어스의 신뢰할 수있는 추정값을 사용할 수 있습니다.
따라서 불이익 추정치의 표준 오류를보고하면 스토리의 일부만 알 수 있습니다. 그것은 편견으로 인한 부정확성을 완전히 무시하고 큰 정밀도의 잘못된 인상을 줄 수 있습니다. 부트 스트랩 기반 신뢰 구간과 같이 추정치 분산의 평가만을 기반으로하는 신뢰 진술을하는 것은 확실히 실수입니다.