«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

4
직선 활성화 기능은 신경망에서 사라지는 기울기 문제를 어떻게 해결합니까?
신경 네트워크 의 배니싱 그래디언트 문제에 대한 해결책으로 여러 곳에서 정류 선형 유닛 (ReLU)이 칭찬했습니다 . 즉, max (0, x)를 활성화 함수로 사용합니다. 활성화가 양성일 때, 이것은 시그 모이 드 활성화 기능보다 낫다는 것이 명백하다. 그 파생은 큰 x에 대해 임의적으로 작은 값 대신에 항상 1이기 때문이다. 반면에, x가 0보다 …

2
임의의 숲에서 변수의 중요도 측정
나는 회귀를 위해 임의의 숲을 가지고 놀았으며 두 가지 중요한 측정 수단의 의미와 해석 방법을 정확하게 파악하는 데 어려움을 겪고 있습니다. importance()함수는 각 변수에 대한 두 값을 제공한다 : %IncMSE및 IncNodePurity. 이 두 값에 대한 간단한 해석이 있습니까? 의 경우 IncNodePurity특히,이 단순히 양이 그 변수의 제거 다음 RSS 증가입니까?

5
LDA vs 워드 2 벡
단어 유사성을 계산하기 위해 Latent Dirichlet Allocation 과 word2vec의 유사점이 무엇인지 이해하려고합니다 . 내가 이해하는 바와 같이, LDA는 단어를 잠재 주제 의 확률 벡터로 매핑하는 반면, word2vec는 실제 숫자 벡터로 매핑합니다 (점별 상호 정보의 특이 값 분해와 관련이 있습니다 . O. Levy, Y. Goldberg, "Neural Word Embedding" "암시 적 행렬 …

7
신경망의 데이터 정규화 및 표준화
신경망 (ANN)을 사용하여 복잡한 시스템의 결과를 예측하려고합니다. 결과 (종속) 값의 범위는 0에서 10,000 사이입니다. 입력 변수마다 범위가 다릅니다. 모든 변수는 대략 정규 분포를 갖습니다. 훈련 전에 데이터를 확장하는 다른 옵션을 고려합니다. 한 가지 옵션은 각 변수의 평균 및 표준 편차 값을 독립적으로 사용하여 누적 분포 함수 를 계산 하여 입력 …

6
100 % 정확도 결정 트리를 얻는 이유는 무엇입니까?
의사 결정 트리의 정확도가 100 %입니다. 내가 무엇을 잘못하고 있지? 이것은 내 코드입니다. import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test = x[0:658] y_train …

3
랜덤 포레스트와 매우 랜덤 화 된 트리의 차이점
랜덤 포레스트와 매우 랜덤 화 된 트리는 랜덤 포레스트에있는 트리의 분할이 결정론적인 반면, 매우 랜덤 화 된 트리의 경우에는 랜덤이라는 점에서 차이가 있음을 이해했습니다. 현재 트리에 대해 선택된 변수에서 임의의 균일 분할 중). 그러나 나는 다양한 상황 에서이 다른 분열의 영향을 완전히 이해하지 못합니다. 편향 / 분산 측면에서 어떻게 비교합니까? …

3
딥 러닝에서 하이퍼 파라미터 선택 지침
스택 형 자동 인코더 또는 딥 믿기 네트워크와 같은 딥 아키텍처의 하이퍼 파라미터를 선택하는 방법에 대한 지침을 제공하는 데 도움이되는 논문을 찾고 있습니다. 하이퍼 파라미터가 많고 선택하는 방법이 매우 혼란 스럽습니다. 또한 훈련에 많은 시간이 걸리기 때문에 교차 유효성 검사를 사용하는 것도 옵션이 아닙니다!

3
온라인 대 오프라인 학습?
오프라인 학습 과 온라인 학습 의 차이점은 무엇입니까 ? 전체 데이터 세트 (오프라인)에 대한 학습과 점진적 학습 (한 번에 하나의 인스턴스)에 대한 학습의 문제입니까? 두 알고리즘 모두에 사용되는 알고리즘의 예는 무엇입니까?

3
로서
TL, DR은 : 그것은 그 표시 반대로 조언을 자주 반복하는, 교차 검증 (LOO-CV)두고 온 아웃 -이며,KKK 와 -fold CVKKK (주름의 수)와 동일한NNN (개수 관찰) 훈련의 -있는 일반화 오류의 수익률 추정치 적어도 어떤을위한 변수KKK , 아닌 대부분의 변수를 특정 가정 안정성 (잘 모르겠어요 모델 / 알고리즘, 데이터 세트, 또는 두 가지 …

6
많은 범주 형 변수로 분류 개선
200,000 개 이상의 샘플과 샘플 당 약 50 개의 기능으로 데이터 세트를 작성하고 있습니다. 10 개의 연속 변수와 다른 40 개는 범주 형 변수 (국가, 언어, 과학 분야 등)입니다. 이러한 범주 형 변수의 경우 예를 들어 150 개의 다른 국가, 50 개의 언어, 50 개의 과학 분야 등이 있습니다. 지금까지 …

4
수학의 강력한 배경이 ML의 필수 요건입니까?
나는 내 자신의 스킬 셋을 발전시키기 시작했고 항상 머신 러닝에 매료되었습니다. 그러나 6 년 전에는 이것을 추구하는 대신 컴퓨터 과학과 전혀 관련없는 학위를 받기로 결정했습니다. 나는 약 8-10 년 동안 소프트웨어와 응용 프로그램을 개발 해 왔으므로 잘 다루었지만 기계 학습 / 확률 / 통계의 수학 측면에 침투하는 것처럼 보이지 않습니다. …

3
StackExchange 웹 사이트에서 머신 러닝 방법 적용
이번 학기 에는 머신 러닝 과정이 있으며 교수는 실제 문제 를 찾아 수업에 도입 된 머신 러닝 방법 중 하나를 통해 해결 하도록 요청 했습니다. 의사 결정 트리 인공 신경망 벡터 머신 지원 인스턴스 기반 학습 ( kNN , LWL ) 베이지안 네트워크 강화 학습 나는 stackoverflow 및 stackexchange 의 …

5
"자체를 물리 치는"예측 모델을 처리하는 방법?
저는 주요 소매점의 ML 전문가가 프레젠테이션을보고 있었는데 여기서 재고 부족 이벤트를 예측하는 모델을 개발했습니다. 시간이 지남에 따라 모델이 매우 정확 해 졌다고 가정 해 보자. 즉, 모델이 실제로 제대로 작동하면 품절 이벤트를 예상하고 피할 수 있으며 결국 품절 이벤트가 거의 또는 전혀없는 지점에 도달 할 수 있습니다. 그러나이 경우 모델을 …

4
컴퓨터 비전과 컨볼 루션 신경망에서 번역 불일치 란 무엇입니까?
컴퓨터 비전에 대한 배경 지식이 없지만 이미지 처리 및 회선 신경망 관련 기사 및 논문을 읽을 때 끊임없이 translation invariance, 또는 이라는 용어에 직면합니다 translation invariant. 또는 컨볼 루션 작업이 제공하는 많은 것을 읽었 translation invariance습니까? !! 이것은 무엇을 의미 하는가? 나는 우리가 어떤 모양으로 이미지를 바꾸더라도 이미지의 실제 개념은 …

3
'epoch', 'batch'및 'minibatch'의 차이점은 무엇입니까?
내가 아는 한 Stochastic Gradient Descent를 학습 알고리즘으로 채택 할 때 누군가는 전체 데이터 세트에 'epoch'를 사용하고 단일 업데이트 단계에서 사용되는 데이터에 'batch'를 사용하고 다른 하나는 'batch'와 'minibatch'를 사용합니다. 다른 사람들은 'epoch'와 'minibatch'를 사용합니다. 이것은 논의하는 동안 많은 혼란을 가져옵니다. 그렇다면 올바른 말은 무엇입니까? 아니면 그들은 모두 허용되는 방언입니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.