«lasso» 태그된 질문

계수를 0으로 축소하여 일부를 0으로 만드는 회귀 모형의 정규화 방법입니다. 따라서 올가미는 기능 선택을 수행합니다.

1
r의 올가미를 사용한 다변량 선형 회귀
상관 관계가 높은 많은 종속 변수 (DV) (~ 450)를 예측하기 위해 축소 된 모델을 만들려고합니다. 내 독립 변수 (IV)도 많고 (~ 2000) 서로 관련이 있습니다. 올가미를 사용하여 각 출력에 대해 축소 된 모델을 개별적으로 선택하면 각 종속 변수를 반복 할 때 동일한 독립 변수 하위 집합을 얻을 수 없습니다. R에서 …


1
설명 모델을위한 LASSO : 축소 된 매개 변수입니까?
데이터를 이해하는 것이 주요 목표 인 분석을 수행하고 있습니다. 데이터 집합은 교차 검증 (10k)에 충분할 정도로 크고 예측 변수에는 연속 변수와 더미 변수가 모두 포함되며 결과는 연속적입니다. 주요 목표는 모형을보다 쉽게 ​​해석 할 수 있도록 일부 예측 변수를 추출하는 것이 합당한 지 확인하는 것이 었습니다. 질문 : 내 질문은 "어떻게 …

1
올가미 모델에서 제외되거나 올가미 모델에 포함 된 변수를 해석하는 방법은 무엇입니까?
변수의 p- 값 또는 표준 편차를 계산하는 작업이 여전히 진행 중이기 때문에 올가미 모델에 들어가는 예측 변수에 '중요도'또는 '중요도'를 표시 할 수 없다는 다른 게시물을 얻었습니다. 이러한 추론 하에서, 올가미 모델에서 배제 된 변수가 '무의미한'또는 '무의미한'이라고 말할 수 없다고 주장하는 것이 옳은가? 그렇다면 올가미 모델에 제외되거나 포함 된 변수에 대해 …

1
올가미 제제 사이의 연결
이 질문은 멍청 할 수도 있지만 올가미 회귀 의 두 가지 다른 공식이 있음을 알았습니다 . 우리는 알고 올가미 문제는 목적이 광장 손실 플러스로 구성된 최소화하는 것입니다LLL-1 페널티 기간, 다음과 같이 표현 minβ∥y−Xβ∥22+λ∥β∥1minβ‖y−Xβ‖22+λ‖β‖1 \min_\beta \|y - X \beta\|_2^2 + \lambda \|\beta\|_1 \; 그러나 종종 올가미 추정기가 β^n(λ)=argminβ{12n∥y−Xβ∥22+λ∥β∥1}β^n(λ)=arg⁡minβ{12n‖y−Xβ‖22+λ‖β‖1} \hat{\beta}_n(\lambda) = \displaystyle\arg …
9 lasso 

1
glmnet은 과대 산포를 어떻게 처리합니까?
카운트 데이터를 통해 텍스트를 모델링하는 방법, 특히 lasso기법을 사용하여 기능을 줄이는 방법에 대한 질문이 있습니다. 온라인 기사가 N 개 있고 각 기사에 대한 페이지 뷰 수가 있다고 가정합니다. 각 기사마다 1 그램과 2 그램을 추출했으며 1,2 그램에 대해 회귀 분석을 원했습니다. 피처 (1,2 그램)는 관측치보다 훨씬 많으므로 올가미는 피처 수를 …

3
k 범주 형 변수에 해당하는 회귀 스무딩 스플라인에서 k 매듭을 선택 했습니까?
환자의 나이 (년 단위로 측정 된 정수 수량)가 예측 변수 중 하나 인 예측 비용 모델을 작성 중입니다. 연령과 입원 위험 사이의 강력한 비선형 관계가 분명합니다. 환자 연령에 대한 처벌 회귀 스무딩 스플라인을 고려하고 있습니다. 에 따르면 통계 학습의 요소 (Hastie 등, 2009, 151), 최적의 매듭 배치는 회원 시대의 고유 …

4
시차의 순서를 올가미?
형식의 종단 데이터가 있다고 가정합니다 여러 관측 값이 있습니다. 이것은 하나의 형태 일뿐입니다). 제한에 관심이 있습니다. 제한없는 는 와 것과 같습니다. .Y=(Y1,…,YJ)∼N(μ,Σ)Y=(Y1,…,YJ)∼N(μ,Σ)\mathbf Y = (Y_1, \ldots, Y_J) \sim \mathcal N(\mu, \Sigma)ΣΣ\SigmaΣΣ\SigmaYj=αj+∑ℓ=1j−1ϕℓjYj−ℓ+εjYj=αj+∑ℓ=1j−1ϕℓjYj−ℓ+εj Y_j = \alpha_j + \sum_{\ell = 1} ^ {j - 1} \phi_{\ell j} Y_{j-\ell} + \varepsilon_j εj∼N(0,σj)εj∼N(0,σj)\varepsilon_j \sim N(0, …

2
데이터에 대한 ROC 곡선 계산
그래서, 나는 16 개의 시험을 가지고 있는데, 여기에서 Hamming Distance를 사용하여 생체 특성으로부터 사람을 인증하려고합니다. 임계 값이 3.5로 설정되었습니다. 내 데이터는 다음과 같으며 1 번 시험 만 참 긍정입니다. Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.