«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.


5
성향 점수는 회귀 분석에서 공변량을 추가하는 것과 어떻게 다릅니 까?
나는 성향 점수와 인과 분석에 비교적 익숙하지 않다는 것을 인정한다. 새로 온 사람으로서 나에게 분명하지 않은 한 가지는 성향 점수를 사용한 "밸런싱"이 회귀 분석에서 공변량을 추가 할 때 발생하는 것과 수학적으로 어떻게 다른가? 연산에서 다른 점은 무엇이며 회귀 분석에서 소집단 공변량을 추가하는 것보다 더 나은 이유는 무엇입니까? 방법을 실험적으로 비교하는 …

5
능선 회귀 솔루션을 도출하는 방법은 무엇입니까?
능선 회귀에 대한 솔루션 도출에 문제가 있습니다. 정규화 용어가없는 회귀 솔루션을 알고 있습니다. β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. 그러나 L2 항 를 비용 함수에 추가 한 후 솔루션은 어떻게됩니까?λ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.


4
모형을 만들 때 통계적으로 유의하지 않은 공변량을 '유지'해야합니까?
모형 계산에 여러 공변량이 있으며 모두 통계적으로 유의하지는 않습니다. 그렇지 않은 것을 제거해야합니까? 이 질문은 현상에 대해 설명하지만 ANCOVA에서 공변량의 유의하지 않은 영향을 해석하는 방법은 무엇입니까? 그 질문에 대한 답에는 중요하지 않은 공변량이 제거 될 것을 암시하는 것은 없지만, 지금 당장은 그들이 머물러 있어야한다고 생각하는 경향이 있습니다. 일부 임계 값 …

6
최하위 회귀 분석 vs. 올가미
최소 각도 회귀와 올가미는 매우 유사한 정규화 경로를 생성하는 경향이 있습니다 (계수가 0을 초과하는 경우를 제외하고 동일합니다). 둘 다 사실상 동일한 알고리즘으로 효율적으로 맞출 수 있습니다. 한 가지 방법을 다른 방법보다 선호하는 실질적인 이유가 있습니까?
39 regression  lasso 

3
로지스틱 회귀를 맞추기 전에 표준화가 필요합니까?
제 질문은 로지스틱 회귀를 맞추기 전에 모든 변수가 [0,1] 사이에서 동일한 척도를 갖도록 데이터 세트를 표준화해야한다는 것입니다. 공식은 다음과 같습니다. xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} 내 데이터 세트에는 2 개의 변수가 있으며 두 채널에 대해 동일한 것을 설명하지만 볼륨이 다릅니다. 두 상점의 고객 방문 횟수라고 가정하면 여기에서 고객의 구매 여부가 결정됩니다. 고객은 구매하기 전에 …

3
다항식 회귀는 왜 다중 선형 회귀의 특별한 경우로 간주됩니까?
다항식 회귀 분석이 비선형 관계를 모델링하는 경우 다중 선형 회귀 분석의 특별한 경우로 간주 할 수있는 방법은 무엇입니까? Wikipedia는 "다항식 회귀 분석은 비선형 모형을 데이터에 적합하지만 통계적 추정 문제로서 회귀 함수 가 데이터로부터 추정 된 미지의 모수에서 선형이라는 점에서 선형 적이라는 점에서 선형 적입니다. "E(y|x)E(y|x)\mathbb{E}(y | x) 모수가 2 인 …

5
콕스 회귀 예측
다변량 콕스 회귀 분석을 수행 중이며 중요한 독립 변수와 베타 값이 있습니다. 이 모델은 내 데이터에 매우 적합합니다. 이제 저는 모델을 사용하고 새로운 관측의 생존을 예측하고 싶습니다. Cox 모델 로이 작업을 수행하는 방법을 잘 모르겠습니다. 선형 또는 로지스틱 회귀 분석에서는 쉬울 것입니다. 회귀 분석에 새로운 관찰 값을 넣고 베타로 곱하면 …

2
포아송과 음 이항 회귀는 언제 같은 계수에 적합합니까?
R에서 푸 아송과 음 이항 (NB) 회귀는 항상 범주 형이지만 연속적이지 않은 예측 변수에 대해 동일한 계수에 맞는 것으로 나타났습니다. 예를 들어, 범주 형 예측 변수를 사용한 회귀 분석은 다음과 같습니다. data(warpbreaks) library(MASS) rs1 = glm(breaks ~ tension, data=warpbreaks, family="poisson") rs2 = glm.nb(breaks ~ tension, data=warpbreaks) #compare coefficients cbind("Poisson"=coef(rs1), "NB"=coef(rs2)) …

8
변경 점수에 대한 독립 변수의 효과를 테스트 할 때 기준 측정 값을 제어 변수로 포함하는 것이 유효합니까?
OLS 회귀를 실행하려고합니다. DV : 1 년에 걸친 체중 변화 (초기 체중-최종 체중) IV : 운동 여부. 그러나 무거운 사람이 얇은 사람보다 운동 단위당 더 많은 체중을 잃는 것이 합리적입니다. 따라서 제어 변수를 포함하고 싶었습니다. CV : 초기 시작 무게. 그러나 이제 초기 가중치 를 사용하여 종속 변수 AND를 제어 …

1
회귀 분석과 PCA에서 데이터를 중심에 놓으면 어떻게 절편을 제거 할 수 있습니까?
나는 인터셉트를 제거하기 위해 ( 이 질문 에서 언급 한 바와 같이) 데이터를 중심에 둔 인스턴스에 대해 계속 읽습니다 (예 : 정규화 또는 PCA ). 나는 그것이 단순하다는 것을 알고 있지만, 이것을 직관적으로 이해하는 데 어려움을 겪고 있습니다. 누군가 내가 읽을 수있는 직관이나 참조를 제공 할 수 있습니까?

2
이항 회귀 분석에 대한 R의 출력 해석
나는 이항 데이터 테스트를 통해 이것에 대해 아주 새로운 것이지만 하나를 수행해야했지만 이제 결과를 해석하는 방법을 잘 모르겠습니다. 반응 변수 인 y- 변수는 이항이고 설명 요소는 연속적입니다. 이것이 결과를 요약 할 때 얻은 것입니다. glm(formula = leaves.presence ~ Area, family = binomial, data = n) Deviance Residuals: Min 1Q Median …

3
로서
TL, DR은 : 그것은 그 표시 반대로 조언을 자주 반복하는, 교차 검증 (LOO-CV)두고 온 아웃 -이며,KKK 와 -fold CVKKK (주름의 수)와 동일한NNN (개수 관찰) 훈련의 -있는 일반화 오류의 수익률 추정치 적어도 어떤을위한 변수KKK , 아닌 대부분의 변수를 특정 가정 안정성 (잘 모르겠어요 모델 / 알고리즘, 데이터 세트, 또는 두 가지 …

3
SVM과 로지스틱 회귀 비교
누군가 SVM 또는 LR을 언제 선택할지에 대한 직감을 줄 수 있습니까? 나는 두 목표의 초평면 학습의 최적화 기준 사이의 차이점이 무엇인지에 대한 직관을 이해하고 싶습니다. 각 목표는 다음과 같습니다. SVM : 가장 가까운 지원 벡터 사이의 마진을 최대화하려고 LR : 사후 클래스 확률 최대화 SVM과 LR의 선형 피처 공간을 고려해 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.