«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
비모수 회귀 분석을위한 최상의 피처 선택 방법
초보자 질문입니다. 현재 R의 np 패키지를 사용하여 비모수 적 회귀 분석을 수행하고 있습니다. 7 가지 기능이 있고 무차별 대입 방식을 사용하여 최고의 3을 식별했습니다. 그러나 곧 7 가지 이상의 기능을 갖게 될 것입니다! 내 질문은 비모수 회귀에 대한 기능 선택에 가장 적합한 방법은 무엇입니까? 패키지가 메소드를 구현하는 경우 감사합니다.

1
계량 분석법의 실제 적용에 대한 문서화 / 재생 가능한 예?
이 질문은 매우 광범위하게 들릴지 모르지만 여기에 내가 찾는 것이 있습니다. 계량 경제법에 관한 훌륭한 책과 계량법에 대한 훌륭한 설명이 많이 있습니다. 이 CrossValidated question에 설명 된 것처럼 재현 가능한 계량 경제학 예제 도 있습니다 . 실제로이 질문의 예는 내가 찾고있는 것에 매우 가깝습니다. 이 예제에서 누락 된 것은 연구 …

4
Ross Quinlan의 C5.0에 대한 MATLAB 및 R 인터페이스 구축
Ross Quinlan 의 C5.0에 MATLAB 및 R 인터페이스를 구축하는 것을 고려하고 있습니다 (C5.0은 의사 결정 트리 알고리즘 및 소프트웨어 패키지이며 C4.5 의 확장입니다 ). 내가 작성해야 할 구성 요소에 대한 이해를 얻으십시오. C5.0에 대해 찾은 유일한 문서는 여기 에 있으며 See5 (C5.0에 대한 Windows 인터페이스)에 대한 자습서입니다. 타르 파일은 메이크,하지만 …

1
Gaussian Process / Dirichlet Process와 같은 확률 적 프로세스에는 밀도가 있습니까? 그렇지 않은 경우 Bayes 규칙을 어떻게 적용 할 수 있습니까?
Dirichlet Pocess 및 Gaussian Process는 종종 "분포에 대한 분포"또는 "분포에 대한 분포"라고합니다. 이 경우 GP에서 함수의 밀도에 대해 의미있게 이야기 할 수 있습니까? 즉, 가우시안 프로세스 또는 디리클레 프로세스에 확률 밀도 개념이 있습니까? 그렇지 않은 경우, 함수의 사전 확률 개념이 잘 정의되지 않은 경우 Bayes의 규칙을 사용하여 후부보다 먼저 이동할 …

3
대규모 데이터 세트에 대한 가우스 프로세스 회귀
나는 온라인 비디오와 강의 노트에서 가우시안 프로세스 회귀에 대해 배웠으며, 점이 있는 데이터 세트가 있으면 데이터가 차원 다변량 가우시안 에서 샘플링되었다고 가정합니다 . 그래서 내 질문은 가우스 프로세스 회귀가 여전히 작동 하는 이 1 천만입니다. 커널 매트릭스가 프로세스를 완전히 비효율적으로 렌더링하지 않습니까? 그렇다면 여러 번 반복해서 데이터 세트에서 샘플링하는 것과 …

2
AlphaZero 용지의 디리클레 노이즈의 목적
DeepMind의 AlphaGo Zero 및 AlphaZero 논문에서는 Monte Carlo Tree Search의 루트 노드 (보드 상태)의 사전 동작 확률에 Dirichlet 노이즈를 추가하는 방법에 대해 설명합니다 . 루트 노드 의 사전 확률에 Dirichlet 노이즈를 추가하여 추가 탐색을 수행합니다 . 특히 . 여기서 및 ; 이 소음으로 인해 모든 이동이 시도 될 수 있지만 …

1
임의 푸리에 기능이 음이 아닌 이유는 무엇입니까?
랜덤 푸리에 기능은 커널 기능에 대한 근사치를 제공합니다. SVM 및 Gaussian 프로세스와 같은 다양한 커널 방법에 사용됩니다. 오늘은 TensorFlow 구현을 사용해 보았고 기능의 절반에 대해 음수 값을 얻었습니다. 내가 알기로는 이런 일이 일어나지 않아야합니다. 그래서 나는 원래의 논문으로 되돌아갔습니다. 예상했던 것처럼 기능이 [0,1]에 있어야한다고 말합니다. 그러나 그 설명 (아래 강조 …

1
SVM은 어떻게 템플릿 일치합니까?
SVM에 대해 읽고 최적화 문제를 해결하고 있으며 최대 마진 아이디어가 매우 합리적이라는 것을 알게되었습니다. 이제 커널을 사용하면 비선형 분리 경계까지도 찾을 수 있습니다. 지금까지 SVM (특수 커널 머신)과 커널 머신이 신경망과 어떤 관련이 있는지 전혀 모른다. Yann Lecun => 의 의견을 고려 하십시오 . kernel methods were a form of …


1
표본 R의 제곱을 계산하는 방법은 무엇입니까?
나는 이것이 아마도 다른 곳에서 논의되었을 것이라는 것을 알고 있지만, 명확한 대답을 찾지 못했습니다. 선형 회귀 모델의 표본 외부 를 계산 하기 위해 공식 를 사용하려고합니다 . 여기서 은 잔차 제곱의 합이고 는 총 제곱합입니다. 훈련 세트의 경우,R2=1−SSR/SSTR2=1−SSR/SSTR^2 = 1 - SSR/SSTR2R2R^2SSRSSRSSRSSTSSTSST SST=Σ(y−y¯train)2SST=Σ(y−y¯train)2 SST = \Sigma (y - \bar{y}_{train})^2 테스트 …

4
경사 하강이 필요한 이유는 무엇입니까?
비용 함수를 차별화하고 모든 매개 변수에 대해 부분 미분을 통해 얻은 방정식을 풀어 매개 변수를 찾고 비용 함수가 최소 인 위치를 찾을 수 있습니다. 또한 파생 상품이 0 인 여러 장소를 찾을 수 있다고 생각합니다. 따라서 모든 장소를 확인할 수 있고 글로벌 최소값을 찾을 수 있습니다 왜 경사 하강이 대신 …

1
딥 러닝을위한 데이터가 얼마나됩니까?
딥 러닝 (특히 CNN)과 과적 합을 방지하기 위해 일반적으로 많은 양의 데이터가 필요한 방법에 대해 배우고 있습니다. 그러나 모델의 용량 / 용량이 많을수록 과적 합을 방지하기 위해 더 많은 데이터가 필요하다고 들었습니다. 따라서 내 질문은 : 심층 신경망에서 레이어 당 레이어 / 노드 수를 줄이고 왜 적은 양의 데이터로 작동하게 …

1
SVM이 여전히 우수한 응용 프로그램이 있습니까?
SVM 알고리즘은 상당히 오래되었습니다. 1960 년대에 개발되었지만 1990 년대와 2000 년대에 매우 인기가있었습니다. 머신 러닝 과정의 고전적인 부분입니다. 오늘날 미디어 처리 (이미지, 사운드 등)에서 신경망이 완전히 지배적 인 반면 다른 영역에서는 그라디언트 부스팅이 매우 강력한 위치에 있습니다. 또한 최근 데이터 경쟁에서 SVM 기반 솔루션이 관찰되지 않았습니다. SVM이 여전히 최신 결과를 …

1
word2vec에서 교차 엔트로피 손실의 유도
cs224d 온라인 스탠포드 클래스 코스 자료 의 첫 번째 문제 세트 를 통해 노력 하고 있는데 문제 3A와 관련하여 문제가 있습니다. softmax 예측 함수 및 교차 엔트로피 손실 함수와 함께 스킵 그램 word2vec 모델을 사용할 때 예측 된 단어 벡터에 대한 기울기를 계산하려고합니다. 따라서 softmax 기능이 주어집니다. wi^=Pr(wordi∣r^,w)=exp(wTir^)∑|V|jexp(wTjr^)wi^=Pr(wordi∣r^,w)=exp⁡(wiTr^)∑j|V|exp(wjTr^) \hat{w_i} = …

2
버킷 화란 무엇입니까?
운이없는 머신 러닝에서 "버킷 화"에 대한 명확한 설명을 찾기 위해 노력하고 있습니다. 지금까지 이해 한 것은 버킷 화가 연속적인 값의 범위가 하나의 이산 값으로 대체되는 디지털 신호 처리의 양자화와 유사하다는 것입니다. 이 올바른지? 버킷 화 적용의 장단점 (정보 손실의 명백한 영향 외에)은 무엇입니까? 버킷 화 적용 방법에 대한 경험 규칙이 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.