«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

3
Quantile 회귀에 비해 선형 회귀의 장점은 무엇입니까?
선형 회귀 모델은 가정의 무리하게 분위수 회귀는 선형 회귀의 가정이 충족되는 경우, 다음 내 직감 (그리고 매우 제한된 경험) 평균 회귀 선형 회귀 거의 동일한 결과를 얻을 것입니다하지 않습니다. 선형 회귀는 어떤 장점이 있습니까? 확실히 더 친숙하지만 그 이외의 것입니까?


5
회귀 모형을 개선하기 위해 평균 절대 오차의 상자 그림을 기반으로 특이 치를 제거하는 것이 부정입니까?
아래 상자 그림에서 볼 수 있듯이 네 가지 방법으로 테스트 한 예측 모델이 있습니다. 모델이 예측하는 속성의 범위는 0-8입니다. 당신은이 있음을 알 수 있습니다 하나의 상한선 이상치 와 세 하한 이상치 모든 방법으로 지적했다. 데이터에서 이러한 인스턴스를 제거하는 것이 적절한 지 궁금합니다. 아니면 예측 모델을 개선하기 위해 일종의 부정 행위입니까?

1
두 회귀 계수의 비 편향 추정량?
편향 추정치 의 목표로 선형 / 물류 회귀 분석 를 가정합니다 . 과 는 추정에서 노이즈에 대해 매우 긍정적 이라고 확신합니다 .a 1g(y)=a0+a1⋅x1+a2⋅x2g(y)=a0+a1⋅x1+a2⋅x2g(y) = a_0 + a_1\cdot x_1 + a_2\cdot x_2 a1a2a1a2a1a2\frac{a_1}{a_2}a1a1a_1a2a2a_2 공동 공분산 있는 경우 답을 계산하거나 적어도 시뮬레이션 할 수 있습니다. 더 나은 방법이 있습니까, 많은 데이터에 대한 …

4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
QR 분해 이해
나는 더 많은 것을 이해하려고 노력한 예제 (R)를 가지고 있습니다. 선형 모델을 만들기 위해 Limma를 사용하고 있으며 폴드 변경 계산에서 단계별로 어떤 일이 일어나고 있는지 이해하려고합니다. 나는 주로 계수 계산에 어떤 일이 발생하는지 알아 내려고 노력하고 있습니다. 내가 알아낼 수있는 것에서 QR 분해는 계수를 얻는 데 사용되므로 본질적으로 계산중인 방정식 …

2
편차-분산 트레이드 오프에 관한 질문
편향-분산 트레이드 오프, 추정 자의 편향과 모델의 편향 사이의 관계, 그리고 추정 자의 분산과 모형의 분산 사이의 관계를 이해하려고합니다. 나는 이러한 결론에 도달했다. 추정 자의 편향을 무시할 때, 즉 모형의 분산을 무시하는 모형의 편향 만 최소화하려는 경우 (즉, 고려하지 않고 추정 자의 분산을 최소화하는 것을 목표로하는 경우) 데이터를 과적 합하는 …

1
선형 모델의 경우 BLUE (OLS 솔루션) 이외의 다른 편견없는 추정량
선형 모델의 경우 OLS 솔루션은 매개 변수에 가장 적합한 선형 편향 추정기를 제공합니다. 물론 우리는 융기 회귀와 같은 낮은 분산에 대한 편견으로 거래 할 수 있습니다. 그러나 내 질문은 편견이 없다는 것입니다. 편향되지는 않지만 OLS 추정 매개 변수보다 분산이 큰 다소 일반적으로 사용되는 다른 추정기가 있습니까? 거대한 데이터 세트를 가지면 …

1
설정의 회귀 : 정규화 방법 (올가미, PLS, PCR, 융기)을 선택하는 방법은 무엇입니까?
나는 갈 수 있는지 여부를 확인하려 능선 회귀 , LASSO , 주성분 회귀 (PCR), 또는 부분 최소 제곱 변수 / 기능 (의 수가 많은 경우 상황에서 (PLS) ppp ) 및 샘플의 작은 수 ( n<pn<pn np>10np>10np>10n 변수 ( 및 Y )는 서로 다른 각도로 서로 관련 되어 있습니다.XXXYYY 내 질문은이 …

3
이 분산 데이터의 분산 예측
이 분산 데이터에 대해 회귀 분석을 시도하고 있는데, 여기서 선형 편차로 평균 오차뿐만 아니라 오차 분산도 예측 하려고합니다 . 이 같은: 와이( x , t )ξ( x , t )와이¯( x , t )σ( x , t )= y¯( x , t ) + ξ(x,t),∼N(0,σ(x,t)),=y0+ax+bt,=σ0+cx+dt.y(x,t)=y¯(x,t)+ξ(x,t),ξ(x,t)∼N(0,σ(x,t)),y¯(x,t)=y0+ax+bt,σ(x,t)=σ0+cx+dt.\begin{align}\\ y\left(x,t\right) &= \bar{y}\left(x,t\right)+\xi\left(x,t\right),\\ \xi\left(x,t\right) &\sim …

4
데이터를 변환 할 때 피해야 할 위험은 무엇입니까?
응답을 이중으로 변환 한 후 XXX 와 YYY 변수 사이에 강한 선형 관계를 얻었습니다 . 모델은 Y∼XY∼XY\sim X 이지만 √로 변환했습니다. R2를 .19에서 .76으로YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X} 개선하는 X.R2R2R^2 분명히 나는이 관계에 대해 괜찮은 수술을했다. 과도한 변환의 위험 또는 통계적 원칙 위반 가능성과 같이이 작업의 함정에 대해 토론 할 수있는 사람이 있습니까?

1
귀무 가설 하에서 교환 가능한 샘플의 직관은 무엇입니까?
순열 검정 (랜덤 화 검정, 재 랜덤 화 검정 또는 정확한 검정이라고도 함)은 매우 유용하며, 예를 들어 요구되는 정규 분포 가정이 t-test충족되지 않고 순위에 따라 값을 변환 할 때 유용합니다. 비모수 테스트 Mann-Whitney-U-test는 더 많은 정보가 손실 될 수 있습니다. 그러나 이러한 종류의 테스트를 사용할 때 단 하나의 가정 만 …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
변환 할 때 비정규 데이터를 유지하는 비정규 데이터에 대해 회귀를 수행하려면 어떻게해야합니까?
21 개 설문지 항목에 대한 리 커트 척도 답변에서 파생 된 일부 데이터 (158 건)가 있습니다. 설문지의 어떤 항목이 전체 항목에 대한 응답을 예측하는지 확인하기 위해 회귀 분석을 수행하고 싶습니다 (만족도). 응답은 (KS 테스트에 따라) 정상적으로 배포되지 않으며 내가 생각할 수있는 모든 방식 (역, 로그, log10, sqrt, 제곱)으로 변환했으며 정규 …

2
영향력있는 지점, 높은 레버리지 지점 및 특이점 간의 정확한 의미와 비교
위키 백과에서 영향력있는 관측치 는 회귀 모형의 예측에 상대적으로 큰 영향을주는 관측치입니다. 위키 백과에서 레버리지 포인트 는 독립적 인 변수의 극한 또는 외부 값에서 수행 된 관측 값으로, 주변 관측치가 부족하면 적합 회귀 모형이 해당 특정 관측치에 가깝게 통과 함을 의미합니다. Wikipedia 에서 다음과 같은 비교 를 하는 이유 있지만 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.