«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

4
맥파든의 의사 R2 해석
지불 (1 = 지불 및 0 = 지불 없음)이라는 종속 변수가있는 McFadden의 의사 R 제곱이 0.192 인 이진 로지스틱 회귀 모델이 있습니다. 이 의사 R- 제곱의 해석은 무엇입니까? 중첩 모델에 대한 상대 비교입니까 (예 : 6 개의 변수 모델의 McFadden의 의사 R- 제곱은 0.192이지만 5 개의 변수 모델 (상기 6 …


4
RMSLE (Root Mean Squared Logarithmic Error)를 어떻게 해석합니까?
RMSLE (Root Mean Squared Logarithmic Error)을 사용하여 장비 범주의 판매 가격을 예측하는 성능을 평가하는 기계 학습 경쟁을 해왔습니다. 문제는 최종 결과의 성공을 해석하는 방법을 잘 모르겠다는 것입니다. 예를 들어 의 RMSLE을 달성 하면 지수 지수 높이고 rmse처럼 해석 할 수 있습니까? (예 : )?1.0521.0521.052eeee1.052=2.863=RMSEe1.052=2.863=RMSEe^{1.052}=2.863=RMSE 그런 다음 내 예측이 실제 가격과 …

3
scikit-learn을 사용한 다항식 회귀
다항식 회귀 분석에 scikit-learn을 사용하려고합니다. 다항식 회귀를 읽는 것에서 선형 회귀의 특별한 경우가 있습니다. scikit의 일반 선형 모델 중 하나가 고차 다항식에 맞게 매개 변수화 될 수 있기를 바랐지만 그렇게 할 수있는 옵션이 없습니다. 폴리 커널과 함께 Support Vector Regressor를 사용했습니다. 그것은 내 데이터의 하위 집합과 잘 작동하지만 더 큰 …

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

4
로지스틱 회귀 분석에서 비용 함수는 어떻게 도출됩니까?
Coursera에서 기계 학습 스탠포드 코스를하고 있습니다. 로지스틱 회귀에 관한 장에서 비용 함수는 다음과 같습니다. 그런 다음 여기에서 파생됩니다. 비용 함수의 미분을 얻으려고했지만 완전히 다른 것을 얻었습니다. 파생 상품은 어떻게 얻습니까? 중개 단계는 무엇입니까?

1
가정이 충족되지 않을 때 회귀 모형이 얼마나 잘못 되었습니까?
회귀 모델을 피팅 할 때 출력의 가정이 충족되지 않으면 어떻게됩니까? 잔차가 동형이 아닌 경우 어떻게됩니까? 잔차가 잔차 대 적합 그림에서 증가하거나 감소하는 패턴을 나타내는 경우 잔차가 정규 분포를 따르지 않고 Shapiro-Wilk 테스트에 실패하면 어떻게됩니까? 정규성 Shapiro-Wilk 검정은 매우 엄격한 검정이며, 경우에 따라 정상 -QQ 플롯이 다소 합리적으로 보일지라도 데이터가 검정에 …

1
폐쇄 형 올가미 솔루션의 파생이 왜 올바르지 않습니까?
βlasso=argminβ∥y−Xβ∥22+α∥β∥1βlasso=argminβ⁡‖y−Xβ‖22+α‖β‖1\beta^{\text{lasso}}= \operatorname*{argmin}_\beta \| y-X\beta\|^2_2 + \alpha \| \beta\|_1βlassoj=sgn(βLSj)(|βLSj|−α)+βjlasso=sgn(βjLS)(|βjLS|−α)+ \beta_j^{\text{lasso}}= \mathrm{sgn}(\beta^{\text{LS}}_j)(|\beta_j^{\text{LS}}|-\alpha)^+ XXX 그러나 왜 일반적으로 닫힌 양식 솔루션이 없는지 이해하지 못합니다. 차등을 사용하여 다음을 얻었습니다. ( XXX 는 n×pn×pn \times p 매트릭스입니다) = n ∑ i = 1 ( y i - X i β ) 2 + α p ∑ …

5
선형 회귀에 대한 동성애 가정을 위반하면 어떤 위험이 있습니까?
예를 들어 ChickWeightR의 데이터 세트를 고려하십시오 . 분산은 시간이 지남에 따라 분명히 커지므로 다음과 같은 간단한 선형 회귀를 사용하면 다음과 같습니다. m <- lm(weight ~ Time*Diet, data=ChickWeight) 내 질문 : 모델의 어떤 측면에 의문이 생길까요? 문제가 Time범위를 벗어나는 것으로 제한 됩니까? 이 가정의 위반에 대한 선형 회귀는 얼마나 관대합니까 (즉,이 …

4
GLM에 대한 의사 R 제곱 공식
나는 R, Julian J. Faraway (p. 59)로 선형 모델 확장 책에서 pseudo 에 대한 공식을 찾았습니다 .아르 자형2아르 자형2R^2 1 - ResidualDevianceNullDeviance1−잔류 편차NullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . 이것이 GLM에 대한 의사 의 일반적인 공식 입니까?아르 자형2아르 자형2R^2

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


6
왜 단 변량 회귀와는 달리 다변량 회귀가 필요한가?
방금이 훌륭한 책을 찾아 보았습니다 : Johnson과 Wichern의 다변량 통계 분석을 적용했습니다 . 아이러니 한 점은, 여전히 개별 단 변량 (회귀) 모델 대신 다변량 (회귀) 모델을 사용하는 동기를 이해할 수 없다는 것입니다. 나는 (a) 다변량 회귀 분석과 다변량 회귀 분석 결과의 해석을 설명하는 stats.statexchange post 1 과 2 를 겪었 …

3
독립 변수를 중심에두고 왜 주요 효과를 조정할 수 있습니까?
이 CV 스레드에서 영감을 얻은 다중 회귀 및 상호 작용과 관련된 질문이 있습니다. 중심 변수를 사용한 상호 작용 항 계층 회귀 분석? 우리는 어떤 변수를 중심에 두어야합니까? 중재 효과를 확인할 때 독립 변수를 중심에두고 중심 변수를 곱하여 교호 작용 항을 계산합니다. 그런 다음 회귀 분석을 실행하고 주요 효과와 상호 작용 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.