통계 및 빅 데이터 libsvm

7

현재 데이터를 분류하기 위해 선형 커널과 함께 SVM을 사용하고 있습니다. 훈련 세트에 오류가 없습니다. 매개 변수 ( )에 여러 값을 시도했습니다 . 테스트 세트의 오류는 변경되지 않았습니다.CCC10−5,…,10210−5,…,10210^{-5}, \dots, 10^2 지금은 궁금해 :이 오류가 루비 바인딩으로 인한 위해 libsvm내가 (사용하고 RB-libsvm을 ) 또는 이것이 이론적으로 설명 할 ? 매개 변수 항상 …

134 machine-learning svm libsvm

2

libsvm 데이터 형식 [닫힘]

지원 벡터 분류를 위해 libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) 도구를 사용하고 있습니다. 그러나 입력 데이터의 형식이 혼란 스럽습니다. 읽어보기에서 : 교육 및 테스트 데이터 파일의 형식은 다음과 같습니다. <label> <index1>:<value1> <index2>:<value2> ... . . . 각 줄은 인스턴스를 포함하며 '\ n'문자로 끝납니다. 분류의 <label>경우 클래스 레이블을 나타내는 정수입니다 (다중 클래스 지원). …

31 machine-learning svm python libsvm c++

1

자유도는 정수가 아닌 숫자 일 수 있습니까?

GAM을 사용할 때 잔여 DF는 (코드의 마지막 줄). 그게 무슨 뜻이야? GAM 예제를 넘어 서면 일반적으로 자유도는 정수가 아닌 숫자 일 수 있습니까?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

1

libsvm“최대 반복 횟수에 도달”경고 및 교차 유효성 검사

C-SVC 모드에서 2 차 다항식 커널로 libsvm을 사용하고 있으며 여러 SVM을 훈련시켜야합니다. 각 트레이닝 세트에는 10 개의 기능과 5000 개의 벡터가 있습니다. 훈련하는 동안 훈련하는 대부분의 SVM에 대해이 경고가 표시됩니다. WARNING: reaching max number of iterations optimization finished, #iter = 10000000 누군가이 경고가 의미하는 바를 설명하고 어떻게 피할 수 있습니까? …

20 machine-learning cross-validation svm regularization libsvm

3

불균형 데이터를위한 SVM

데이터 세트에서 SVM (Support Vector Machine)을 사용하려고합니다. 그래도 문제를 시도하기 전에 SVM이 불균형이 심한 데이터에서 제대로 작동하지 않는다는 경고를 받았습니다. 제 경우에는 최대 95-98 % 0과 2-5 % 1을 가질 수 있습니다. 스파 스 / 언밸런스 드 데이터에서 SVM 사용에 대해 이야기 한 리소스를 찾으려고했지만 'sparseSVM'(소량의 지원 벡터를 사용) 만 …

15 svm libsvm unbalanced-classes

4

기존 SVM 모델에 교육 데이터를 추가 할 수 있습니까?

libsvm을 사용하고 있는데 svmtrain ()을 호출 할 때마다 새 모델을 만들고 기존 모델에 데이터를 넣을 수있는 옵션이없는 것 같습니다. 그러나 이것이 가능합니까? libsvm 에서이 측면을 보지 못합니까?

14 svm libsvm

1

캐럿 glmnet vs cv.glmnet

glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

14 r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

2

e1071 libsvm에 문제가 있습니까?

두 개의 겹치는 클래스, 각 클래스의 7 점, 2 차원 공간에있는 데이터 세트가 있습니다. R에서는 패키지 svm에서 실행 e1071하여 이러한 클래스에 대한 분리 초평면을 작성합니다. 다음 명령을 사용하고 있습니다. svm(x, y, scale = FALSE, type = 'C-classification', kernel = 'linear', cost = 50000) 여기서 x내 데이터 요소와 y레이블이 포함되어 있습니다. …

13 r machine-learning svm libsvm e1071

1

Fisher의 정확한 테스트 및 초기 하 분포

피셔의 정확한 테스트를 더 잘 이해하고 싶기 때문에 f와 m이 남성과 여성에 해당하고 n과 y가 "소다 소비"에 해당하는 다음 장난감 예제를 고안했습니다. > soda_gender f m n 0 5 y 5 0 분명히 이것은 과감한 단순화이지만 컨텍스트가 방해되는 것을 원하지 않았습니다. 여기서 나는 남자들이 음료수를 마시지 않고 여자들은 음료수를 마시고 …

12 fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

2

다중 클래스 분류에서 Scikit SVM의 출력은 항상 동일한 레이블을 제공합니다

현재 Scikit learn을 다음 코드로 사용하고 있습니다. clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0, class_weight='auto') 그런 다음 7 개의 서로 다른 레이블이있는 일련의 데이터를 적합하게 예측합니다. 이상한 결과가 나왔습니다. 유효성 검사 세트에서 예측 된 레이블을 사용하는 교차 유효성 검사 기술에 관계없이 항상 레이블 7이됩니다. 전체 기본 매개 변수 ()를 포함하여 …

10 svm scikit-learn libsvm multi-class optunity

4

R의 이산 시간 이벤트 기록 (생존) 모델

R에 이산 시간 모델을 맞추려고하지만 어떻게 해야할지 모르겠습니다. 종속 변수를 각 시간 관찰마다 하나씩 다른 행 glm으로 구성하고 logit 또는 cloglog 링크와 함께 함수를 사용할 수 있다는 것을 읽었습니다. 이런 의미에서, 나는 세 개의 열이 있습니다 : ID, Event(각 시간 경과시 1 또는 0) 및 Time Elapsed(관측 시작부터 ) 그리고 …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

2

이진 분류 문제에 사용할 SVM 커널은 무엇입니까?

나는 벡터 머신을 지원할 때 초보자입니다. 특정 문제에 가장 적합한 커널 (예 : 선형, 다항식)을 나타내는 지침이 있습니까? 내 경우에는 특정 정보가 포함되어 있는지 여부에 따라 웹 페이지를 분류해야합니다. 즉, 이진 분류 문제가 있습니다. 일반적으로이 작업에 가장 적합한 커널을 말할 수 있습니까? 아니면 특정 데이터 세트에서 여러 데이터를 사용 해보고 …

9 classification svm model-selection libsvm kernel-trick

2

서포트 벡터 머신과 함께 감마 파라미터 사용

사용하는 경우 libsvm, 파라미터 커널 함수에 대한 파라미터이다. 기본값은γγ\gammaγ=1number of features.γ=1number of features.\gamma = \frac{1}{\text{number of features.}} 그리드 검색과 같은 기존 방법 외에이 매개 변수 설정에 대한 이론적 지침이 있습니까?

9 machine-learning svm data-mining libsvm kernel-trick

«libsvm» 태그된 질문