«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

1
선형 회귀 분석에서 정규화가 매개 변수 값에도 페널티를주는 이유는 무엇입니까?
현재 능선 회귀를 배우고 더 복잡한 모델의 처벌 (또는 더 복잡한 모델의 정의)에 대해 약간 혼란 스러웠습니다. 내가 이해 한 바에 따르면, 모델의 복잡성이 다항식과 반드시 ​​관련이있는 것은 아닙니다. 따라서 는 보다 더 복잡한 모델입니다.2 + 3 + 4엑스2+ 5엑스삼+ 6엑스42+삼+4엑스2+5엑스삼+6엑스4 2 + 3+ 4x^2 + 5x^3 + 6x^45엑스55엑스5 5x^5 …

2
로지스틱 회귀 분석이 잘 수행 된 이유와 교정 방법을 망치는 방법은 무엇입니까?
scikit에서 확률 보정에 대한 문서를 배우면 로지스틱 회귀 분석을 다른 방법과 비교하고 랜덤 포레스트가 로지스틱 회귀 분석보다 덜 교정되었음을 나타냅니다. 로지스틱 회귀 분석이 잘 조정 된 이유는 무엇입니까? 어떻게 로지스틱 회귀의 교정을 망칠 수 있습니까?

3
다른 회귀 변수에 대한 로지스틱 회귀 분석 잔차 회귀
연속 반응에 OLS 회귀를 적용하면 각 공변량에서 잔차의 회귀를 순차적으로 실행하여 다중 회귀 방정식을 만들 수 있습니다. 내 질문은 로지스틱 회귀 잔차 를 통해 로지스틱 회귀로 이것을 수행하는 방법이 있습니까? 내가 추정 할 경우 즉, 접근 방식을 모델링 선형 일반화 된 표준을 사용하여에 대한 로지스틱 회귀 분석을 실행하는 방법이 X …

1
정규화 된 선형 대 RKHS 회귀
나는 RKHS 회귀의 정규화와 선형 회귀의 차이점을 연구하고 있지만 두 가지의 중요한 차이점을 파악하기가 어렵습니다. 주어진 입력-출력 쌍 이면 함수 를 다음과 같이 추정하고 싶습니다. 여기서 는 커널 함수입니다. 계수 은 를 풀면 찾을 수 있습니다. 여기서 약간의 표기법 남용으로 커널 행렬 K 의 i, j 번째 항목 인 {\ …

4
선형 모형을 피팅 한 후 피팅 잔차를 바이어스 및 분산으로 분해 할 수 있습니까?
데이터 포인트를 더 복잡한 모델이 필요하거나 더 복잡한 모델이 필요하지 않은 것으로 분류하고 싶습니다. 내 현재 생각은 모든 데이터를 간단한 선형 모델에 맞추고 잔차의 크기를 관찰 하여이 분류를 만드는 것입니다. 그런 다음 오차에 대한 편차 및 분산 기여에 대해 몇 가지를 읽었으며 바이어스를 직접 계산할 수 있으면 총 오차 (잔여 …

1
선형 회귀의 바이어스-분산 분해에서의 분산 항
'통계 학습의 요소'에서 선형 모형의 바이어스-분산 분해에 대한 표현은 여기서 은 실제 대상 함수이고 는 모델의 임의 오차의 분산입니다. 및 의 선형 추정기 인 .이자형r r (엑스0) =σ2ϵ+ E[ f(엑스0) − E에프^(엑스0)]2+ | | h (엑스0) ||2σ2ϵ,Err(x0)=σϵ2+E[f(x0)−Ef^(x0)]2+||h(x0)||2σϵ2,Err(x_0)=\sigma_\epsilon^2+E[f(x_0)-E\hat f(x_0)]^2+||h(x_0)||^2\sigma_\epsilon^2,에프(엑스0)f(x0)f(x_0)σ2ϵσϵ2 \sigma_\epsilon^2와이= f( x ) + ϵy=f(x)+ϵy=f(x)+\epsilon에프^( x )f^(x)\hat f(x)에프( x )f(x)f(x) 이 …

1
이 다항식 회귀 분석에서 베이지안 신뢰 구간이 왜 편향인데 신뢰 구간이 올바른지?
아래 그림과 같이 데이터를 시뮬레이션 한 플롯을 고려하십시오. 우리는 이진 결과 를 살펴보고 , 실제 확률이 1 일 때 검은 선으로 표시됩니다. 공변량 와 사이의 기능적 관계는 로지스틱 링크가있는 3 차 다항식이므로 양방향에서는 비선형입니다.와이o b syobsy_{obs}엑스xxp (와이o b s= 1 | x )p(yobs=1|x)p(y_{obs}=1 | x) 녹색 선은 가 3 차 …

1
데밍 회귀 분석을 사용하는 경우
현재 두 가지 인 테스트 값을 서로 변환하는 방법을 연구 중입니다. 배경 토양에서 식물 이용 가능한 인을 측정하는 많은 (추출) 방법이 있습니다. 국가마다 다른 방법을 적용하기 때문에 국가 간 P- 불임을 비교하려면 P- 테스트 값 y를 기준으로 P- 테스트 값 x를 계산해야하며 그 반대도 마찬가지입니다. 따라서 반응과 공변량은 상호 교환 …

3
다중 공선 성이 존재할 때 선형 회귀 계수의 통계적 유의성 결정
인구 규모가 다른 여러 도시가 있고 도시의 주류 판매점 수와 DUI 수 사이에 긍정적 인 선형 관계가 있는지 확인하고 싶다고 가정합니다. 추정 된 회귀 계수의 t- 검정을 기반으로이 관계가 유의한지 여부를 결정합니다. 이제 분명히 팝. 도시의 규모는 DUI의 수와 주류 판매점의 수와 양의 상관 관계가 있습니다. 따라서 주류 판매점에서 간단한 …

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
콕스 위험 모델 생존 곡선을 어떻게 해석합니까?
콕스 비례 위험 모델의 생존 곡선을 어떻게 해석합니까? 이 장난감 예 age에서 kidney데이터의 변수에 대한 cox 비례 위험 모델이 있고 생존 곡선을 생성 한다고 가정 합니다. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() 예를 들어, 시간 에 어떤 진술이 참입니까? 또는 둘 다 잘못 되었습니까?200200200 진술 1 : …

1
Anova 결과에 사용되는 제곱합 유형의 논문에서 왜 거의보고되지 않습니까?
통계에 대한 나의 짧은 경험에 따르면, 분산 분석 결과를 얻는 데 사용되는 제곱합 유형 (유형 I, II, III, IV ...)은 테스트 결과 (특히 상호 작용이 있거나 누락 된 모델의 경우)에 극적인 차이를 만들 수 있습니다. 데이터). 그러나 나는 아직보고 한 논문을 보지 못했다. 왜 이렇게이다? 어떤 식 으로든 통계 자체가 …

2
선형 회귀 : * 왜 * 제곱합을 분할 할 수 있습니까?
이 게시물은 이변 량 선형 회귀 모델을 나타냅니다. Yi=β0+β1xiYi=β0+β1xiY_i = \beta_0 + \beta_1x_i. 나는 항상 총 제곱합 (SSTO)을 오차의 제곱합 (SSE)과 모델의 SSR (제곱합)으로 나누었다. 왜 작동합니까? 나는이 부분 않는 이해 : yiyiy_i : y의 관측 값 y¯y¯\bar{y}: 모든 관측 된 의 평균yiyiy_i y^iy^i\hat{y}_i : 주어진 관측치의 x에 대한 y의 …


1
논문에서 가우스 프로세스 회귀 방정식의 도출에 대한 의심
나는 이 논문 프리 프린트를 읽고 있으며 가우시안 프로세스 회귀에 대한 방정식의 도출에 어려움을 겪고있다. 그들은 Rasmussen & Williams 의 설정 및 표기법을 사용합니다 . 따라서 가산 성, 제로 평균, 고정 및 정규 분포 노이즈σ2noiseσnoise2\sigma^2_{noise} 가정 : y=f(x)+ϵ,ϵ∼N(0,σ2noise)y=f(x)+ϵ,ϵ∼N(0,σnoise2)y=f(\mathbf{x})+\epsilon, \quad \epsilon\sim N(0,\sigma^2_{noise}) 평균이 0 인 GP는 f(x)f(x)f(\mathbf{x}), 의미하는 것은 ∀ d∈N∀ …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.