«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
선형 판별 분석은 차원을 어떻게 줄입니까?
91 페이지의 "통계 학습의 요소"의 단어가 있습니다. p- 차원 입력 공간의 K 중심은 대부분의 K-1 차원 부분 공간에 걸쳐 있으며, p가 K보다 훨씬 크면 이것은 차원이 상당히 떨어질 것입니다. 두 가지 질문이 있습니다. p- 차원 입력 공간의 K 중심이 대부분의 K-1 차원 부분 공간에 걸쳐있는 이유는 무엇입니까? K 중심은 어떻게 …

2
딥 러닝 및 의사 결정 트리 및 부스팅 방법
나는 경험적으로나 이론적으로 비교하고 토론하는 논문이나 텍스트를 찾고 있습니다. Random Forests 또는 AdaBoost 및 GentleBoost 와 같은 Boosting and Decision tree 알고리즘 은 의사 결정 트리에 적용됩니다. 와 같은 깊은 학습 방법 제한 볼츠만 기계 , 계층 임시 메모리 , 길쌈 신경망 등, 보다 구체적으로, 속도, 정확성 또는 수렴 측면에서이 …

5
대규모 텍스트 분류
텍스트 데이터를 분류하려고합니다. 나는 300 classes수업 당 200 개의 교육 문서를 가지고 60000 documents in total있으며 이것은 매우 높은 차원의 데이터 를 초래할 가능성 이있다 (우리는 1 백만 개 이상의 차원을 보고있을 것이다 ). 파이프 라인에서 다음 단계를 수행하고 싶습니다 (내 요구 사항에 대한 이해를 돕기 위해). 각 문서를 피처 …


3
배치 크기는 SGD의 수렴에 어떤 영향을 줍니까?
많은 논의에서 비슷한 결론을 보았습니다. 미니 배치 크기가 커질수록 SGD의 수렴이 실제로 더 어려워지고 악화됩니다. 이 논문 과 이 답변을 . 또한 초기 단계에서 소규모 학습 속도 또는 배치 크기와 같은 트릭을 사용하여 배치 크기가 큰 문제를 해결하는 사람들에 대해 들었습니다. 그러나 미니 배치의 평균 손실이 데이터 분포에 대한 예상 …

2
미니 배치 훈련 신경망을 위해 무작위로 추출 된 훈련 샘플을 교체없이 추출해야합니까?
우리는 에포크가 사용 가능한 모든 훈련 샘플 전체를 통과 한 것으로 정의하고, 미니 배치 크기는 그라디언트를 내리는 데 필요한 가중치 / 바이어스에 대한 업데이트를 평균화하는 평균 샘플 수로 정의합니다. 내 질문은 에포크 내에서 각 미니 배치를 생성하기 위해 일련의 교육 예제를 대체하지 않고 끌어 야하는지 여부입니다. 실제로 에포크 종료 요구 …

2
강화 학습에서 보상 기능을 만드는 방법
강화 학습을 공부하는 동안 저는 , 및 현재 상태에만 의존하는 보상 기능 등 여러 형태의 보상 기능을 접했습니다. 하지만 보상 기능을 '만들거나'정의하기가 쉽지 않다는 것을 깨달았습니다.R(s,a)R(s,a)R(s,a)R (s,a,s′)R(s,a,s')R(s,a,s') 내 질문은 다음과 같습니다. 보상 기능을 만드는 방법에 대한 규칙이 있습니까? 보상 기능에는 다른 형태가 있습니까? 예를 들어, 아마도 국가에 따라 다항식 형태입니까?

2
더미 기능 (및 기타 이산 / 범주 기능)을 통한 이상 탐지
tl; dr discrete이상 감지를 수행 할 때 데이터 를 처리하는 권장 방법은 무엇입니까 ? categorical이상 감지를 수행 할 때 데이터 를 처리하는 권장 방법은 무엇입니까 ? 이 답변 은 개별 데이터를 사용하여 결과를 필터링하는 것이 좋습니다. 아마도 범주 값을 perctage 관찰 가능성으로 대체 하시겠습니까? 소개 이것은 처음으로 여기에 게시되므로 형식이나 …

3
멀티 클래스 분류기를 여러 이진 분류기보다 낫습니까?
URL을 카테고리로 분류해야합니다. 모든 URL을 0으로 분류하려는 15 개의 카테고리가 있다고 가정 해 보겠습니다. 15-way 분류 기가 더 낫습니까? 여기서 15 개의 레이블이 있고 각 데이터 포인트에 대한 기능을 생성합니다. 또는 15 개의 이진 분류기를 작성하십시오 (예 : 영화 또는 영화가 아닌 경우).


2
멀티 클래스 SVM을 수행하는 가장 좋은 방법
SVM이 이진 분류기라는 것을 알고 있습니다. 다중 클래스 SVM으로 확장하고 싶습니다. 그것을 수행하는 가장 좋고, 가장 쉬운 방법은 어느 것입니까? 코드 : MATLAB u=unique(TrainLabel); N=length(u); if(N>2) itr=1; classes=0; while((classes~=1)&&(itr<=length(u))) c1=(TrainLabel==u(itr)); newClass=double(c1); tst = double((TestLabel == itr)); model = svmtrain(newClass, TrainVec, '-c 1 -g 0.00154'); [predict_label, accuracy, dec_values] = svmpredict(tst, TestVec, …

2
능선 회귀 분류 기가 왜 텍스트 분류에 잘 작동합니까?
텍스트 분류를 실험하는 동안 SVM, NB, kNN 등과 같이 텍스트 마이닝 작업에 더 일반적으로 언급되고 적용되는 분류기 중 테스트를 지속적으로 능가하는 능선 분류기 결과를 찾았습니다. 매개 변수에 대한 간단한 조정을 제외 하고이 특정 텍스트 분류 작업에서 각 분류자를 최적화하는 데 도움이됩니다. 이러한 결과는 Dikran Marsupial 에서도 언급 되었습니다 . 통계 …


4
해석 가능한 모델을 원한다면 선형 회귀 이외의 방법이 있습니까?
랜덤 포레스트 또는 그래디언트 부스팅과 같은 "ML 모델"은 설명하기 어렵거나 "해석 할 수 없다"고 생각하기 때문에 선형 회귀 분석 이외의 모델을 예측에 사용하지 않는 일부 통계학자가 발생했습니다. 선형 회귀 분석에서 가정 집합이 확인되면 (오류의 정상 성, 균일 성, 다중 공선 성이 없음) t- 검정은 변수의 중요성을 테스트하는 방법을 제공합니다. 내 …

1
임의 부엌 싱크대는 어떻게 작동합니까?
작년 NIPS 2017에서 Ali Rahimi와 Ben Recht는 논문 "대규모 커널 머신 을위한 랜덤 기능 " 에서 무작위 기능을 도입 한 후 시간이 지남에 따라 테스트를 거쳤으며 , 이후 무작위 부엌 싱크 알고리즘으로 체계화되었습니다. 논문 발표의 일환으로, 모델은 5 줄의 MATLAB에서 구현 될 수 있음을 보여주었습니다. % Approximates Gaussian Process regression …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.