«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
포화 비선형 성이라는 용어는 무엇을 의미합니까?
나는 Deep Convolutional Neural Networks를 사용한 ImageNet 분류를 읽고 있었고 3 장에서는 Convolutional Neural Network의 아키텍처를 설명하고 그들이 어떻게 사용하는 것이 바람직한 지 설명했습니다. 비 포화 비선형 성 에프( x ) = m a x ( 0 , x ) 입니다.f(x)=max(0,x).f(x) = max(0, x). 훈련하는 것이 더 빠르기 때문입니다. 이 …

5
통계 및 기계 학습에서 두 그룹 간 구별 : 가설 검정 vs. 분류 대 군집
A와 B라는 레이블이 붙은 두 개의 데이터 그룹 (예 : 200 개의 샘플과 1 개의 기능을 포함)이 있고 서로 다른지 알고 싶습니다. 나는 할 수 있었다 : a) 통계 테스트 (예 : t- 테스트)를 수행하여 통계적으로 다른지 확인하십시오. b) 감독 머신 러닝 (예 : 지원 벡터 분류기 또는 임의 포리스트 …

4
교육 데이터 세트에서 수업의 균형을 언제 조정해야합니까?
나는 온라인 교육 과정을 통해 훈련 데이터의 불균형 수업이 문제를 일으킬 수 있다는 점을 배웠다. 불균형이 너무 클 경우 분류 알고리즘이 많은 규칙을 따르기 때문에 좋은 결과를 얻을 수 있기 때문이다. 과제에서 대다수 클래스를 언더 샘플링하여 데이터의 균형을 조정해야했습니다. 그러나이 블로그에서 누군가는 균형 잡힌 데이터가 더 나쁘다고 주장합니다. https://matloff.wordpress.com/2015/09/29/unbalanced-data-is-a-problem-no-balanced-data-is-worse/ 그래서 …


5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
SVM과 퍼셉트론의 차이점
SVM과 퍼셉트론의 차이점과 약간 혼동됩니다. 여기에 나의 이해를 요약하려고 노력하고, 내가 잘못한 부분을 수정하고 내가 놓친 것을 채우십시오. 퍼셉트론은 분리 "거리"를 최적화하려고 시도하지 않습니다. 두 세트를 분리하는 초평면을 찾으면 좋습니다. 반면에 SVM은 "지원 벡터", 즉 가장 가까운 두 개의 샘플 지점 사이의 거리를 최대화하려고합니다. SVM은 일반적으로 "커널 기능"을 사용하여 샘플 …


6
이진 분류를위한 변수 선택 절차
학습 세트의 관측치보다 많은 변수 / 기능이있을 때 이진 분류에 선호 하는 변수 / 기능 선택 은 무엇입니까 ? 여기서 목표는 분류 오류를 최대한 줄이는 기능 선택 절차가 무엇인지 논의하는 것입니다. 우리는 할 수 있습니다 표기법을 수정 일관성을 위해 : 대한 ,하자 수 관찰 학습 세트를 그룹에서 . 따라서 은 …

4
RMSLE (Root Mean Squared Logarithmic Error)를 어떻게 해석합니까?
RMSLE (Root Mean Squared Logarithmic Error)을 사용하여 장비 범주의 판매 가격을 예측하는 성능을 평가하는 기계 학습 경쟁을 해왔습니다. 문제는 최종 결과의 성공을 해석하는 방법을 잘 모르겠다는 것입니다. 예를 들어 의 RMSLE을 달성 하면 지수 지수 높이고 rmse처럼 해석 할 수 있습니까? (예 : )?1.0521.0521.052eeee1.052=2.863=RMSEe1.052=2.863=RMSEe^{1.052}=2.863=RMSE 그런 다음 내 예측이 실제 가격과 …

3
scikit-learn을 사용한 다항식 회귀
다항식 회귀 분석에 scikit-learn을 사용하려고합니다. 다항식 회귀를 읽는 것에서 선형 회귀의 특별한 경우가 있습니다. scikit의 일반 선형 모델 중 하나가 고차 다항식에 맞게 매개 변수화 될 수 있기를 바랐지만 그렇게 할 수있는 옵션이 없습니다. 폴리 커널과 함께 Support Vector Regressor를 사용했습니다. 그것은 내 데이터의 하위 집합과 잘 작동하지만 더 큰 …

2
머신 러닝 분류기의 성능을 통계적으로 비교하는 방법은 무엇입니까?
예상 분류 정확도를 기준으로 한 분류자가 다른 분류기보다 기본 세트에서 통계적으로 더 나은지 테스트하고 싶습니다. 각 분류 자에 대해 기본 집합에서 임의로 학습 및 테스트 샘플을 선택하고 모델을 학습하고 모델을 테스트합니다. 각 분류 자에 대해이 작업을 10 번 수행합니다. 따라서 각 분류기에 대해 10 가지 추정 분류 정확도 측정 값이 …

3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

1
sklearn의 분류 보고서에서 숫자는 무엇을 의미합니까?
sklearn의 sklearn.metrics.classification_report 문서에서 가져온 예가 아래에 있습니다. 내가 이해하지 못하는 것은 클래스가 예측 변수라고 생각되는 각 클래스에 대해 f1 점수, 정밀도 및 리콜 값이있는 이유입니다. f1 점수는 모델의 전체 정확도를 나타냅니다. 또한 지원란에서 무엇을 알려줍니까? 나는 그것에 관한 정보를 찾을 수 없었다. print(classification_report(y_true, y_pred, target_names=target_names)) precision recall f1-score support class …

3
더 정확한 분류기보다 정확도가 낮은 분류기에서 AUC가 더 높은 이유는 무엇입니까?
두 개의 분류 기가 있습니다 A : 순진한 베이지안 네트워크 B : 트리 (단일 연결) 베이지안 네트워크 정확성 및 기타 측정 측면에서 A는 B보다 상대적으로 성능이 좋지 않지만 R 패키지 ROCR 및 AUC를 사용하여 ROC 분석을 수행하면 A의 AUC가 B의 AUC보다 높은 것으로 나타났습니다. 사고? 진 양성 (tp), 위양성 (fp), …

2
SVM 알고리즘의 기본 통계 모델은 무엇입니까?
모델 기반 접근 방식을 사용하여 데이터를 처리 할 때 첫 번째 단계는 데이터 모델을 통계 모델로 모델링하는 것입니다. 다음 단계는이 통계 모델을 기반으로 효율적 / 빠른 추론 / 학습 알고리즘을 개발하는 것입니다. 그래서 어떤 통계 모델이 SVM (Support Vector Machine) 알고리즘 뒤에 있는지 묻고 싶습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.