«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
중첩 교차 검증-훈련 세트에서 kfold CV를 통한 모델 선택과 어떻게 다릅니 까?
나는 종종 사람들이 5x2 교차 유효성 검사에 대해 중첩 된 교차 유효성 검사 의 특별한 경우를 봅니다. 첫 번째 숫자 (여기서는 5)는 내부 루프의 접기 수를 나타내고 두 번째 숫자 (여기서는 2)는 외부 루프의 접기 수를 나타냅니다? 그렇다면 이것이 "전통적인"모델 선택 및 평가 방식과 어떻게 다릅니 까? "전통적인"이라는 말은 데이터 …

3
파이썬을 이용한 시계열 이상 탐지
여러 시계열 데이터 세트에서 이상 감지를 구현해야합니다. 나는 전에 이것을 한 적이 없으며 조언을 기대하고있었습니다. 나는 파이썬에 매우 익숙하므로 솔루션을 구현하는 것을 선호합니다 (대부분의 코드는 내 작업의 다른 부분에 대한 파이썬입니다). 데이터 설명 : 지난 2 년 정도 전에 수집 된 월별 시계열 데이터입니다 (즉, 24-36 시간 만). 기본적으로 여러 …

3
사람들이 부드러운 데이터를 좋아하는 이유는 무엇입니까?
Gaussian Process Regression에 제곱 지수 커널 (SE)을 사용해야합니다. 이 커널의 장점은 다음과 같습니다. 1) 단순 : 3 개의 하이퍼 파라미터; 2) smooth :이 커널은 Gaussian입니다. 사람들이 왜 '부드러움'을 좋아합니까? 가우시안 커널은 무한한 차별화가 가능하지만 그렇게 중요합니까? (SE 커널이 인기있는 다른 이유가 있으면 알려주십시오.) 추신 : 나는 노이즈가없는 실제 세계의 대부분의 …

4
KNN이“모델 기반”이 아닌 이유는 무엇입니까?
ESL 2.4 장에서는 선형 회귀를 "모델 기반"으로 분류하는 것 같습니다.에프( x ) ≈ x ⋅ βf(x)≈x⋅βf(x) \approx x\cdot\betak- 최근 접 이웃에 대해서는 유사한 근사가 언급되지 않는다. 그러나 두 방법이 모두 가정하지는 않습니다.에프( x )f(x)f(x)? 나중에 2.4에서는 다음과 같이 말합니다. 최소 제곱은 에프( x )f(x)f(x) 전역 선형 함수에 의해 근사됩니다. k- …

1
랜덤 포레스트가 MNIST의 2.8 % 테스트 오류보다 훨씬 더 나을 수 있습니까?
나는 MNIST, CIFAR, STL-10 등에 Random Forests를 적용하는 것에 대한 문헌을 찾지 못했기 때문에 순열 불변의 MNIST로 직접 시도 할 것이라고 생각했습니다 . 에서 R , 나는 시도했다 : randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) 2 시간 동안 실행되었으며 2.8 % 테스트 오류가 발생했습니다. 나는 또한 시도 scikit가 배울 와 함께, …

2
한 클래스에 대해서만 분류기
간단한 분류에는 class-0과 class-1의 두 가지 클래스가 있습니다. 일부 데이터에는 class-1의 값만 있으므로 class-0의 값은 없습니다. 이제 클래스 1의 데이터를 모델링하는 모델을 만드는 것에 대해 생각하고 있습니다. 따라서 새로운 데이터가 올 때이 모델은 새로운 데이터에 적용되며 새로운 데이터가이 모델에 얼마나 적합한 지 알 수있는 가능성을 찾습니다. 그런 다음 임계 값과 …

1
커널 메소드의 한계와 커널 메소드 사용시기는 무엇입니까?
커널 방법은 많은 감독 분류 작업에 매우 효과적입니다. 커널 메소드의 한계와 커널 메소드 사용시기는 무엇입니까? 특히 대규모 데이터 시대에서 커널 방법의 발전은 무엇입니까? 커널 메소드와 다중 인스턴스 학습의 차이점은 무엇입니까? 데이터 인 경우 500x10000, 500샘플의 수는, 그리고 10000우리가 커널 방법을 사용할 수 있습니다,이 상황에서 다음, 각 기능의 차원입니까?


3
순위 지정을위한 기계 학습 알고리즘
나는 요소의 집합을 가지고 엑스XX 내가 설명 할 수있는 엔nn형질. 그러므로: 엑스나는: {씨나는 1,씨나는 2, ... ,씨나는 n} ∣엑스나는∈ Xxi:{ci1,ci2,…,cin}∣xi∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X 어디 씨나는 jcijc_{ij} 요소에 대한 (숫자) 평가 나는ii 특성에 따라 제이jj. 내 요소는 점으로 볼 수 있습니다nnn 차원 공간. 내 독서에 따르면, …

2
고차원 데이터 세트에 대한 가우스 프로세스 회귀
누구나 가우시안 프로세스 회귀 (GPR)를 고차원 데이터 세트에 적용한 경험이 있는지 알고 싶었습니다. 다양한 희소 GPR 방법 (예 : 희박 의사 입력 GPR) 중 일부를 조사하여 이상적 특성 선택이 매개 변수 선택 프로세스의 일부인 고차원 데이터 세트에 어떤 효과가 있는지 확인합니다. 시도 할 논문 / 코드 / 또는 다양한 방법에 …

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
KNN에 어떤 유형의 데이터 정규화를 사용해야합니까?
정규화에는 두 가지 이상의 유형이 있다는 것을 알고 있습니다. 예를 들어 1- z- 점수 또는 t- 점수를 사용하여 데이터 변환. 이것을 보통 표준화라고합니다. 2- 0에서 1 사이의 값을 갖도록 데이터 크기 조정 정규화가 필요한 경우 이제 질문 KNN에 어떤 유형의 데이터 정규화를 사용해야합니까? 그리고 왜?

1
내 신경망은 유클리드 거리를 배울 수 없습니다
그래서 나는 신경망을 가르치려고 노력하고 있습니다 (고양이 그림을 분류하지 않고 회귀 응용 프로그램을 위해). 나의 첫 번째 실험은 FIR 필터와 Discrete Fourier Transform ( "전"및 "후"신호에 대한 훈련)을 구현하기 위해 네트워크를 훈련시키는 것이었다. 왜냐하면 그것들은 활성화 기능이없는 단일 계층에 의해 구현 될 수있는 선형 연산이기 때문이다. 둘 다 잘 작동했습니다. …

3
머신 러닝으로 여러 기간 예측
나는 최근에 시계열 지식을 되찾았고 머신 러닝은 대부분 한 걸음 앞서 나간다는 것을 깨달았습니다. 로 한 단계 미리 예측 우리가 시간별 데이터가있는 경우 예를 들어, 자정 등을위한 예측 오전 11시 오전 11시 오전 10시에서 데이터를 사용, I 평균 예측 머신 러닝 방법으로 미리 예측할 수 있습니까? 사전 예측을 사용하면 예를 …

2
베이지안에 테스트 세트가 필요하지 않다는 것이 사실입니까?
필자는 최근 Eric J. Ma의이 강연을 보고 그의 블로그 항목을 확인했습니다. Radford Neal은 Bayesian 모델이 과적 합 (하지만 과적 합할 수는 없음 )이며이를 사용할 때이를 검증하기위한 테스트 세트가 필요하지 않음 을 확인했습니다. 따옴표는 매개 변수를 조정하기 위해 유효성 검사 세트를 사용하는 것에 대해 이야기하는 것 같습니다.) 솔직히 말해서 주장이 저를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.