«importance» 태그된 질문

관심의 결과를 설명하거나 예측할 때 독립 변수 또는 예측 변수의 중요성.

2
임의의 숲에서 변수의 중요도 측정
나는 회귀를 위해 임의의 숲을 가지고 놀았으며 두 가지 중요한 측정 수단의 의미와 해석 방법을 정확하게 파악하는 데 어려움을 겪고 있습니다. importance()함수는 각 변수에 대한 두 값을 제공한다 : %IncMSE및 IncNodePurity. 이 두 값에 대한 간단한 해석이 있습니까? 의 경우 IncNodePurity특히,이 단순히 양이 그 변수의 제거 다음 RSS 증가입니까?

4
가변 중요도 순위는 무엇에 유용합니까?
가변 중요도 순위 (모든 종류의 다변량 모델의 ​​맥락에서)와 관련하여 나는 다소 nihilist가되었습니다 . 종종 업무 수행 중에 다른 팀이 가변 중요도 순위를 생성하도록 지원하거나 내 업무에서 가변 중요도 순위를 생성하도록 요청받습니다. 이러한 요청에 따라 다음과 같은 질문을합니다. 이 변수 중요도 순위는 무엇입니까? 무엇으로부터 배우고 싶습니까? 어떤 결정을 사용하고 싶습니까? 내가받는 …



2
GLMNET의 변수 중요성
기능을 선택하고 이진 대상에 예측 모델을 맞추는 방법으로 올가미를 사용하려고합니다. 아래는 정규화 된 로지스틱 회귀 분석을 시도하기 위해 놀고있는 코드입니다. 내 질문은 "유의 한"변수 그룹을 얻는데 각각의 상대적 중요성을 추정하기 위해 순서를 매길 수 있습니까? 이 순위의 목적을 위해 절대 값으로 계수를 표준화 할 수 있습니까 ( coef함수를 통해 원래 …

5
로지스틱 회귀 분석에 가장 중요한 기능 이해
내 데이터에서 매우 정확한 로지스틱 회귀 분류기를 만들었습니다. 이제 왜 그것이 잘 작동하는지 더 잘 이해하고 싶습니다. 특히, 어떤 기능이 가장 큰 기여를하고 있는지 (어떤 기능이 가장 중요한지) 순위를 매기고, 이상적으로는 각 기능이 전체 모델 (또는이 맥락에서)의 정확성에 기여하는 정도를 수량화하고 싶습니다. 어떻게해야합니까? 내 첫 번째 생각은 계수를 기준으로 순위를 …

2
더미 변수의 기능 중요도
더미 변수로 분류 된 범주 형 변수의 기능 중요성을 얻는 방법을 이해하려고합니다. R 또는 h2o 가하는 방식으로 범주 변수를 처리하지 않는 scikit-learn을 사용하고 있습니다. 범주 형 변수를 더미 변수로 분류하면 해당 변수의 클래스마다 별도의 기능 중요도가 있습니다. 내 질문은, 더미 변수의 중요도를 단순히 범주화하여 범주 변수의 중요도 값으로 재결합하는 것이 …

3
다중 회귀 분석에서 예측 변수 사이에 r 제곱을 나누는 방법은 무엇입니까?
방금 저자가 두 개의 예측 변수로 다중 회귀 분석을 수행 한 논문을 읽었습니다. 전체 r- 제곱 값은 0.65였다. 그들은 두 예측 변수 사이에 r 제곱을 나누는 테이블을 제공했습니다. 테이블은 다음과 같습니다. rsquared beta df pvalue whole model 0.65 NA 2, 9 0.008 predictor 1 0.38 1.01 1, 10 0.002 predictor …

4
다른 예측 변수 집합의 중요성 비교
나는 특정한 문제를 가진 연구생에게 조언하고 있었고,이 사이트에서 다른 사람들의 의견을 듣고 싶어했습니다. 문맥: 연구원은 세 가지 유형의 예측 변수를 가졌습니다. 각 유형에는 다른 개수의 예측 변수가 포함되었습니다. 각 예측 변수는 연속 변수입니다. 소셜 : S1, S2, S3, S4 (예 : 4 개의 예측 변수) 인지 : C1, C2 (예 …

1
랜덤 포레스트에서 왜 트리 레벨이 아닌 노드 레벨에서 기능의 랜덤 서브 세트가 선택됩니까?
내 질문 : 왜 임의 포리스트 는 트리 수준이 아닌 각 트리 내의 노드 수준 에서 분할하기 위해 기능의 임의 하위 집합을 고려 합니까? 배경 : 이것은 역사 문제입니다. 주석 캄 호 출판 이 논문을 무작위로 성장하기 위해서 사용하는 기능의 일부를 선택하여 "결정 숲을"건설에 나무를 2001 년 이후 1998 년 …

2
로지스틱 회귀 분석에서 상대 변수 중요도를 p로 정량화하는 방법은 무엇입니까?
로지스틱 회귀 모델을 사용하여 온라인 구매자가 일련의 온라인 광고 (예측 자 : Ad1, Ad2 및 Ad3)를 클릭 한 후 제품을 구매할지 (결과 : 구매) 여부를 예측한다고 가정합니다. 결과는 1 (구매) 또는 0 (구매되지 않음)의 이진 변수입니다. 예측 변수는 1 (클릭) 또는 0 (클릭)의 이진 변수입니다. 따라서 모든 변수의 규모가 같습니다. …

1
randomForest 및 변수 중요도 버그?
rfobject$importance와 importance(rfobject)MeanDecreaseAccuracy 열에서 차이를 얻지 못합니다. 예: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648 Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105 Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869 Petal.Width 0.349686983 0.318527008 0.270975757 0.31054451 46.323415 > importance(fit) setosa versicolor …


1
관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?
4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.