통계 및 빅 데이터 threshold

3

관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …

77 r self-study lasso regression interpretation anova statistical-significance survey conditional-probability independence naive-bayes graphical-model r time-series forecasting arima r forecasting exponential-smoothing bootstrap outliers r regression poisson-distribution zero-inflation genetic-algorithms machine-learning feature-selection cart categorical-data interpretation descriptive-statistics variance multivariate-analysis covariance-matrix r data-visualization generalized-linear-model binomial proportion pca matlab svd time-series correlation spss arima chi-squared curve-fitting text-mining zipf probability categorical-data distance group-differences bhattacharyya regression variance mean data-visualization variance clustering r standard-error association-measure somers-d normal-distribution integral numerical-integration bayesian clustering python pymc nonparametric-bayes machine-learning svm kernel-trick hyperparameter poisson-distribution mean continuous-data univariate missing-data dag python likelihood dirichlet-distribution r anova hypothesis-testing statistical-significance p-value rating data-imputation censoring threshold

4

분류 확률 임계 값

일반적으로 분류에 관한 질문이 있습니다. f는 일부 데이터 D가 주어진 확률 세트를 출력하는 분류기 (classifier)라고하자. 일반적으로 P (c | D)> 0.5이면 클래스 1을 할당하고 그렇지 않으면 0을 할당한다. 분류). 내 질문은, 내가 알면, 확률을 1로 분류하면 확률이 0.2보다 클 때 분류 기가 더 잘 수행된다는 것입니다. 분류를 수행 할 때이 …

49 machine-learning classification binary-data threshold

5

로지스틱 회귀에 대한 철학적 질문 : 왜 최적의 임계 값이 훈련되지 않습니까?

일반적으로 로지스틱 회귀 분석에서는 모형에 적합하고 훈련 세트에 대한 예측을 얻습니다. 그런 다음 훈련 예측 ( 여기서 와 같은 ) 을 교차 검증 하고 ROC 곡선과 같은 것을 기반으로 최적의 임계 값을 결정합니다. 실제 모델에 임계 값의 교차 검증을 통합하고 전체를 전체적으로 학습하지 않는 이유는 무엇입니까?

13 logistic cross-validation optimization roc threshold

1

F1 최적 임계 값은 무엇입니까? 그것을 계산하는 방법?

R에서 h2o.glm () 함수를 사용하여 결과에 우발성 테이블을 다른 통계와 함께 제공했습니다. 우발 사태 표는 " F1 최적 임계 값에 기초한 크로스 탭 "입니다. Wikipedia 는 F1 Score 또는 F Score를 조화와 정밀도의 조화 평균으로 정의합니다. 그러나 로지스틱 회귀의 예측 값 (예 : 결과)이 컷오프를 사용하여 이진으로 변환 된 경우에만 …

13 threshold

3

SVM의 바이어스 항이 피쳐 벡터의 추가 차원이 아닌 별도로 추정되는 이유는 무엇입니까?

SVM의 최적 초평면은 다음과 같이 정의됩니다. w ⋅ x + b = 0 ,w⋅x+b=0,\mathbf w \cdot \mathbf x+b=0, 여기서 는 임계 값을 나타냅니다. 입력 공간을 일부 공간 매핑하는 매핑 가 있는 경우 공간 에서 SVM을 정의 할 수 있습니다.ϕ Z Z비bbϕϕ\mathbf \phi지ZZ지ZZ w ⋅ ϕ ( x ) + b …

11 svm threshold

2

R randomForests에서 분류 임계 값을 변경하는 방법은 무엇입니까?

모든 종 분포 모델링 문헌은 확률 (예를 들어, 랜덤 포레스트)을 출력하는 모델을 사용하여 종의 존재 유무를 예측할 때 실제로 존재 또는 부재로 종을 분류 할 수있는 임계치 확률의 선택이 중요하며 항상 기본값 인 0.5를 사용하지는 않습니다. 이것에 대한 도움이 필요합니다! 내 코드는 다음과 같습니다. library(randomForest) library(PresenceAbsence) #build model RFfit <- …

10 r classification random-forest threshold

5

이상 감지를위한 자동 임계 값 결정

나는 시계열의 변칙 점수로 작업하고 있습니다 (배경은 컴퓨터 네트워크에서 변칙 탐지입니다). 1 분마다 , 네트워크의 현재 상태가 "예기치 않은"또는 비정상 인 방법을 알려주 는 이상 점수 를 얻습니다 . 점수가 높을수록 현재 상태가 비정상입니다. 5에 가까운 점수는 이론적으로 가능하지만 거의 발생하지 않습니다.엑스티∈[0,5]xt∈[0,5]x_t \in [0, 5] 이제이 변칙적 시계열 의 임계 …

9 time-series outliers threshold

«threshold» 태그된 질문