«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

1
SVM과 비교하여 Support Vector Regression은 어떻게 다릅니 까?
SVM 및 SVR에 대한 기본 사항을 알고 있지만 여전히 여백을 최대화하는 하이퍼 플레인을 찾는 문제가 SVR에 어떻게 부합하는지 알 수 없습니다. 둘째, SVR에서 허용 오차로 사용 된 에 대한 내용을 읽었습니다 . 무슨 뜻이에요?ϵϵ\epsilon 셋째, SVM과 SVR에 사용 된 의사 결정 기능 매개 변수간에 차이가 있습니까?

2
의사 결정 트리 및 회귀-예측 값이 교육 데이터 범위를 벗어날 수 있습니까?
의사 결정 트리와 관련하여 예측 값이 교육 데이터 범위를 벗어날 수 있습니까? 예를 들어, 대상 변수의 학습 데이터 세트 범위가 0-100 인 경우 모델을 생성하고 다른 것으로 적용 할 때 내 값은 -5 일 수 있습니까? 또는 150? 의사 결정 트리 회귀에 대한 나의 이해는 여전히 규칙 기반입니다-왼쪽 / 오른쪽 …


2
가우스 프로세스에서 관측치 병합
회귀에 가우시안 프로세스 (GP)를 사용하고 있습니다. 내 문제에서 두 개 이상의 데이터 포인트 가 상대적으로 길이에 상대적으로 가깝습니다. 문제의 규모. 또한 관측에 소음이 심할 수 있습니다. 계산 속도를 높이고 측정 정확도를 높이려면 더 큰 길이의 예측에 관심이있는 한 서로 가까운 지점의 클러스터를 병합 / 통합하는 것이 자연스러워 보입니다.x⃗ (1),x⃗ (2),…x→(1),x→(2),…\vec{x}^{(1)},\vec{x}^{(2)},\ldots …

2
베이지안 로짓 모형-직관적 인 설명?
저의 학급, 학부 또는 대학원에서 그 용어에 대해 들어 보지 못했다고 고백해야합니다. 로지스틱 회귀 분석이 베이지안이라는 것은 무엇을 의미합니까? 다음과 비슷한 정규 물류에서 베이지안 물류로의 전환에 대한 설명을 찾고 있습니다. 이것은 선형 회귀 모델의 방정식입니다 : .E(y)=β0+β1x1+...+βnxnE(y)=β0+β1x1+...+βnxnE(y) = \beta_0 + \beta_1x_1 + ... + \beta_nx_n 이것은 로지스틱 회귀 모델 식이다 …

2
R의 glmnet을 사용한 릿지 회귀와 파이썬의 scikit-learn의 차이점은 무엇입니까?
James, Witten, Hastie, Tibshirani (2013) 의 저서 'R의 통계 학습에 대한 통계 학습 소개' 에서 Ridge Regression / Lasso에 대한 LAB 섹션 §6.6을 살펴 보겠습니다 . 보다 구체적으로, scikit-learn Ridge모델을 R 패키지 'ISLR'의 'Hitters'데이터 세트에 적용하려고합니다 . R 코드에 표시된 것과 동일한 기능 세트를 작성했습니다. 그러나 glmnet()모델 의 결과에 가까이 …

2
로지스틱 및 로짓 선형 회귀로 추정 한 계수는 언제 다릅니 까?
연속적인 비율 (예 : 측량 사분면에서의 비례 식생 덮개 또는 활동에 종사하는 시간의 비율)을 모델링 할 때, 로지스틱 회귀는 부적절한 것으로 간주됩니다 (예 : Warton & Hui (2011) 아크 사인은 비사 인적입니다 : 생태학에서의 비율 분석 ). 오히려 로짓 변환 후 비율 또는 베타 회귀 후의 OLS 회귀가 더 적합합니다. …
11 r  regression  logistic 

1
R-올가미 회귀-회귀마다 다른 람다
나는 다음을하고 싶다 : 1) 베타 계수를 얻기위한 OLS 회귀 (벌칙 없음) b∗jbj∗b_{j}^{*} ; jjj 는 회귀에 사용되는 변수를 나타냅니다. 나는 이것을한다 lm.model = lm(y~ 0 + x) betas = coefficients(lm.model) 2) 벌칙 용어를 사용한 올가미 회귀 선택 기준은 다음과 같이 주어진 베이지안 정보 기준 (BIC)이어야합니다. λj=log(T)T|b∗j|λj=log⁡(T)T|bj∗|\lambda _{j} = \frac{\log …
11 r  regression  glmnet  lars 

1
음 이항 / 포아송 회귀에서 과분 산과 과소 산포
SAS에서 포아송 회귀 분석을 수행 한 결과 자유 도로 나눈 Pearson 카이 제곱 값이 약 5 인 것으로 나타났습니다. 이는 상당한과 분산을 나타냅니다. 그래서, 나는 proc genmod를 가진 음 이항 모델에 적합하고 Pearson 카이 제곱 값을 자유 도로 나눈 값은 0.80이라는 것을 알았습니다. 이것이 현재 분산되어 있지 않은 것으로 간주됩니까? …

1
회귀 모형의 변수에 대한 제어와 연구 설계의 변수에 대한 제어의 차이점은 무엇입니까?
연구 설계에서 변수를 제어하는 ​​것이 회귀 모델에서 사후 제어를하는 것보다 오류를 줄이는 데 더 효과적이라고 생각합니다. 이 "통제"의 두 가지 사례가 어떻게 다른지 공식적으로 설명해 주시겠습니까? 오류를 줄이고 더 정확한 예측을하는 데 얼마나 효과적입니까?

1
왼쪽 검열 된 데이터에 표준 기계 학습 도구 사용
수입 업체가 유통 업체의 고객 네트워크에서 제품 수요를 예측할 수 있도록하는 예측 애플리케이션을 개발 중입니다. 판매량은 수요를 충족시키기에 충분한 재고가있는 한 수요에 대한 대리입니다. 하지만 재고를 0으로 낮추면 (고객이 피하는 데 도움이되는 상황) 목표를 놓친 부분을 많이 알지 못합니다. 고객이 얼마나 많은 판매를했을까요? 충분한 공급이 있었습니까? Sales를 간단한 대상 변수로 …

2
이차 프로그래밍 및 올가미
올가미 회귀를 수행하려고하는데 다음과 같은 형식이 있습니다. 에서 최소화( Y - X w ) ' ( Y - X w ) + λwww(Y−Xw)′(Y−Xw)+λ|w|1(Y−Xw)′(Y−Xw)+λ|w|1(Y - Xw)'(Y - Xw) + \lambda \;|w|_1 주어지면 2 차 프로그래밍의 도움으로 다음과 같은 형식으로 최적의 를 찾는 것이 좋습니다 .wλλ\lambdawww 따라 에서 를 최소화1xxxX≤B.12x′Qx+c′x12x′Qx+c′x\frac{1}{2} x'Qx + …

1
log (y)를 모델링 할 때 역변환 회귀 결과
에 회귀를 맞추고 있습니다. 지수로 변환점 추정값 (및 신뢰 / 예측 간격)을 역행시키는 것이 유효합니까? 이후로 믿지 않지만 다른 사람의 의견을 원했습니다.log(y)log⁡(y)\log(y)E[f(X)]≠f(E[X])E[f(X)]≠f(E[X])E[f(X)] \ne f(E[X]) 아래의 예는 역변환과의 충돌을 보여줍니다 (.239 대 .219). set.seed(123) a=-5 b=2 x=runif(100,0,1) y=exp(a*x+b+rnorm(100,0,.2)) # plot(x,y) ### NLS Fit f <- function(x,a,b) {exp(a*x+b)} fit <- nls(y ~ …

3
선형 회귀 분석에서 백분율 결과를 사용하는 데 어떤 문제가 있습니까?
많은 결과가 백분율과 같이 표현되는 연구가 있으며 이러한 결과에 대한 일부 범주 형 변수의 영향을 평가하기 위해 여러 선형 회귀 분석을 사용하고 있습니다. 선형 회귀 분석 결과가 연속 분포라고 가정하기 때문에 이러한 모델을 백분율에 적용하는 방법 론적 문제가 있습니까? 0과 100 사이로 제한됩니까?

3
ARIMA 개입 전달 기능-효과를 시각화하는 방법
저는 매월 시계열이 개입되어 있고이 개입이 결과에 미치는 영향을 수량화하고 싶습니다. 나는 시리즈가 다소 짧고 효과가 아직 끝나지 않았다는 것을 알고 있습니다. 자료 cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, 2608L, 3676L, 5763L, 4626L, 3848L, 4523L, …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.