이 질문은 "컨볼 루션 레이어가 정확히 어떻게 작동 하는가"로 요약됩니다 . 그레이 스케일 이미지 가 있다고 가정 합니다. 따라서 이미지에는 하나의 채널이 있습니다. 첫 번째 레이어에서는 필터와 패딩 으로 컨벌루션을 적용합니다 . 그런 다음 회선 및 필터 가있는 다른 회선 레이어가 있습니다. 기능 맵은 몇 개입니까?3 × 3 k 1 …
대용량 데이터 세트 (약 8GB)가 있습니다. 기계 학습을 사용하여 분석하고 싶습니다. 따라서 효율성을 위해 데이터 차원을 줄이려면 SVD와 PCA를 사용해야한다고 생각합니다. 그러나 MATLAB 및 Octave는 이러한 큰 데이터 세트를로드 할 수 없습니다. 이러한 대량의 데이터로 SVD를 수행하는 데 어떤 도구를 사용할 수 있습니까?
기계 학습 의 맥락에서 , 나는 지상 진실 이라는 용어 가 많이 사용되는 것을 보았습니다 . 나는 많은 것을 검색했고 Wikipedia 에서 다음 정의를 찾았습니다 . 기계 학습에서 "지상 진실"이라는 용어는 감독 학습 기술에 대한 훈련 세트 분류의 정확성을 의미합니다. 이는 연구 가설을 입증하거나 반증하기 위해 통계 모델에서 사용됩니다. "지상 …
이제 신경망이 패턴을 인식하고 입력을 분류하기 위해 어떻게 작동하는지 배우기 시작했으며 인공 신경망이 이미지 데이터를 구문 분석하고 이미지를 분류하는 방법 ( convnetjs 데모 )과 그 핵심 을 살펴 보았습니다. 이미지를 다운 샘플링하고 각 픽셀이 하나의 입력 뉴런을 네트워크로 자극합니다. 그러나 문자열 입력으로 가능하다면 머리를 감싸려고합니까? 내가 가진 유스 케이스는 사용자가 …
때 하나 사용하는 것이 Random Forest이상 SVM반대와 반대? 나는 cross-validation모델 비교가 모델 선택의 중요한 측면 이라는 것을 이해 하지만 여기서는 두 가지 방법의 경험 법칙과 경험적 규칙에 대해 더 배우고 싶습니다. 누군가 분류기의 미묘함, 강점 및 약점뿐만 아니라 각각에 가장 적합한 문제를 설명해 주시겠습니까?
R에서 모든 일을하고 있습니다. 문제는 다음과 같습니다. 기본적으로 이력서 (CV) 목록이 있습니다. 일부 응시자는 이전에 업무 경험이 있고 일부는 그렇지 않습니다. 여기서 목표는 이력서의 텍스트를 기반으로 다른 작업 부문으로 분류하고 싶습니다. 나는 지원자가 경험이없는 학생 / 학생 인 경우에 특히 관심이 있으며, 졸업 후이 지원자가 속하는 직업 분야를 분류하기 위해 …
GPU의 '오버 헤드'에 대한 토론을 보았고 '소규모'네트워크의 경우 실제로 GPU보다 CPU (또는 CPU 네트워크)에서 학습하는 것이 더 빠를 수 있습니다. '작은'이란 무엇입니까? 예를 들어, 숨겨진 단위가 100 개인 단일 계층 MLP가 '작은'입니까? '소형'에 대한 정의가 반복 아키텍처에 대해 변경됩니까? CPU 또는 GPU 훈련 여부를 결정할 때 고려해야 할 다른 기준이 …
따라서이 주제에 대한 문헌을 찾을 수 없었지만 생각할 가치가있는 것처럼 보입니다. 새로운 관찰이 가능한 경우 모델 교육 및 최적화에 대한 모범 사례는 무엇입니까? 예측이 저하되기 전에 모델 재 훈련주기 / 빈도를 결정하는 방법이 있습니까? 매개 변수가 집계 된 데이터에 대해 다시 최적화되면 과적 합입니까? 학습이 반드시 온라인 일 필요 는 …
scikit-learn 웹 사이트 에서이 예제 를 따라 임의 포리스트 모델로 다중 출력 분류를 수행합니다. from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) y2 = shuffle(y1, random_state=1) Y = np.vstack((y1, y2)).T …
모델 하이퍼 파라미터 및 모델 매개 변수 와 같은 용어는 사전 설명없이 웹에서 상호 교환 적으로 사용되었습니다. 나는 이것이 잘못되었다고 생각하고 설명이 필요합니다. 기계 학습 모델, SVM / NN / NB 기반 분류기 또는 이미지 인식기를 고려하십시오. 모델 의 하이퍼 파라미터 와 파라미터 는 무엇입니까 ? 예를 들어주세요.
XGBoost는 범주 형 변수와 연속 형 종속 변수를 모두 다루는 데 큰 도움이되었습니다. 그러나 XGBoost 문제에 대해 최적화 된 매개 변수를 어떻게 선택합니까? 이것이 최근 Kaggle 문제에 대한 매개 변수를 적용한 방법입니다. param <- list( objective = "reg:linear", booster = "gbtree", eta = 0.02, # 0.06, #0.01, max_depth = 10, …
Jaccard 유사성 과 코사인 유사성 은 항목 유사성을 비교하는 동안 매우 일반적인 두 가지 측정입니다. 그러나 어떤 상황이 다른 상황보다 선호되는지는 확실하지 않습니다. 누군가이 두 측정의 차이점 (정의 또는 계산이 아닌 개념 또는 원리의 차이점)과 선호하는 응용 프로그램을 명확히하는 데 도움이 될 수 있습니까?
기계 학습 알고리즘 (기본 임의 포리스트 및 선형 회귀 유형 항목)으로 작업하는 약간의 자체 학습 지식이 있습니다. Keras와 함께 RNN을 배우기 시작했습니다. 일반적으로 재고 예측과 관련된 대부분의 예제를 살펴보면 기능 날짜가 1 열이고 출력이 다른 열이 아닌 여러 기능의 기본 예제를 찾을 수 없었습니다. 내가 빠뜨린 중요한 근본적인 것이 있습니까? …