«deep-learning» 태그된 질문

데이터의 계층 적 표현 학습과 관련된 머신 러닝 영역은 주로 심층 신경망을 사용하여 수행됩니다.

2
더 빠른 RCNN 고정
앵커링에 관해 이야기 할 때의 더 빠른 RCNN 논문에서 "참조 상자 피라미드"를 사용한다는 것은 무슨 의미입니까? 이것은 각 W * H * k 앵커 포인트에서 경계 상자가 생성된다는 의미입니까? 여기서 W = 너비, H = 높이 및 k = 종횡비의 수 * 숫자 스케일 종이 링크 : https://arxiv.org/abs/1506.01497

1
SVM은 어떻게 템플릿 일치합니까?
SVM에 대해 읽고 최적화 문제를 해결하고 있으며 최대 마진 아이디어가 매우 합리적이라는 것을 알게되었습니다. 이제 커널을 사용하면 비선형 분리 경계까지도 찾을 수 있습니다. 지금까지 SVM (특수 커널 머신)과 커널 머신이 신경망과 어떤 관련이 있는지 전혀 모른다. Yann Lecun => 의 의견을 고려 하십시오 . kernel methods were a form of …

1
L2 정규화 기능이있는 RNN은 학습을 중지합니다
양방향 RNN을 사용하여 불균형 발생 이벤트를 감지합니다. 긍정적 클래스는 부정적인 클래스보다 100 배 적습니다. 정규화를 사용하지 않는 동안 기차 세트에서 100 % 정확도를 확인하고 유효성 검사 세트에서 30 %를 얻을 수 있습니다. 나는 l2 정규화를 켜고 결과는 학습 시간이 길지 않고 기차 세트에서 30 % 정확도이며 유효성 검사 세트에서 100 …

2
DNN 교육의 CPU 및 GPU 메모리 요구 사항 예측
선택한 미니 배치 크기와 딥 러닝 모델 아키텍처가 있다고 가정 해보십시오. 해당 모델을 학습하기 위해 예상되는 메모리 요구 사항에서 어떻게 도출합니까? 예를 들어, 차원 1000의 입력, 차원 100의 완전히 연결된 숨겨진 계층 4 개 및 차원 10의 추가 출력 계층이있는 (반복되지 않은) 모델을 고려하십시오. 미니 배치 크기는 256 개의 예입니다. …

1
딥 러닝을위한 데이터가 얼마나됩니까?
딥 러닝 (특히 CNN)과 과적 합을 방지하기 위해 일반적으로 많은 양의 데이터가 필요한 방법에 대해 배우고 있습니다. 그러나 모델의 용량 / 용량이 많을수록 과적 합을 방지하기 위해 더 많은 데이터가 필요하다고 들었습니다. 따라서 내 질문은 : 심층 신경망에서 레이어 당 레이어 / 노드 수를 줄이고 왜 적은 양의 데이터로 작동하게 …

3
CNN (Convolutional Neural Networks)을 통해 불균형 데이터 세트를 분류하는 방법은 무엇입니까?
이진 분류 작업에서 불균형 데이터 세트가 있습니다. 양수 양 대 음수 양은 0.3 % 대 99.7 %입니다. 긍정과 부정 사이의 격차가 큽니다. MNIST 문제에 사용 된 구조로 CNN을 훈련하면 테스트 결과에서 높은 음수 비율이 나타납니다. 또한 훈련 오류 곡선은 처음에 몇 개의 에포크에서 빠르게 내려가지만 다음 에포크에서 동일한 값을 유지합니다. …


2
베이지안에 테스트 세트가 필요하지 않다는 것이 사실입니까?
필자는 최근 Eric J. Ma의이 강연을 보고 그의 블로그 항목을 확인했습니다. Radford Neal은 Bayesian 모델이 과적 합 (하지만 과적 합할 수는 없음 )이며이를 사용할 때이를 검증하기위한 테스트 세트가 필요하지 않음 을 확인했습니다. 따옴표는 매개 변수를 조정하기 위해 유효성 검사 세트를 사용하는 것에 대해 이야기하는 것 같습니다.) 솔직히 말해서 주장이 저를 …

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
콕스 위험 모델 생존 곡선을 어떻게 해석합니까?
콕스 비례 위험 모델의 생존 곡선을 어떻게 해석합니까? 이 장난감 예 age에서 kidney데이터의 변수에 대한 cox 비례 위험 모델이 있고 생존 곡선을 생성 한다고 가정 합니다. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() 예를 들어, 시간 에 어떤 진술이 참입니까? 또는 둘 다 잘못 되었습니까?200200200 진술 1 : …

4
회귀에 대한 신경망 훈련은 항상 평균을 예측합니다
이미지에서 상자의 (x, y) 위치를 예측하는 작업 인 회귀를위한 간단한 회선 신경 네트워크를 훈련하고 있습니다. 네트워크의 출력에는 x와 y에 각각 하나씩 두 개의 노드가 있습니다. 나머지 네트워크는 표준 컨볼 루션 신경망입니다. 손실은 상자의 예측 위치와 실제 위치 사이의 표준 평균 제곱 오차입니다. 이 이미지 중 10000 개를 교육하고 2000 년에 …

3
딥 러닝을 이용한 기능 선택?
심층 모델을 사용하여 각 입력 기능의 중요성을 계산하고 싶습니다. - 그러나 나는 깊은 학습을 사용하여 기능 선택에 대한 하나의 종이 발견 깊은 기능 선택을 . 각 피처에 연결된 노드 레이어를 첫 번째 숨겨진 레이어 바로 앞에 삽입합니다. DBN (Deep Faith Network)도 이러한 종류의 작업에 사용될 수 있다고 들었습니다. 그러나 DBN은 …

1
ReLU 뉴런에 대한 입력 정규화
LeCun et al (1998)의 "Efficient Backprop"에 따르면 모든 입력이 0을 중심으로하고 최대 2 차 미분의 범위 내에 있도록 모든 입력을 정규화하는 것이 좋습니다. 예를 들어 "Tanh"함수에 [-0.5,0.5]를 사용합니다. 이것은 Hessian이 더욱 안정적이됨에 따라 역 전파 진행을 돕는 것입니다. 그러나, 나는 정류기 뉴런 (max (0, x))으로 무엇을 해야할지 확신하지 못했습니다. (그 …

2
시퀀스 내 이벤트 예측을위한 LSTM 활용
다음 1 차원 시퀀스를 가정하십시오. A, B, C, Z, B, B, #, C, C, C, V, $, W, A, % ... A, B, C, ..여기의 문자 는 '일반적인'이벤트를 나타냅니다. #, $, %, ...여기의 기호 는 '특별한'이벤트를 나타냅니다 모든 이벤트 사이의 시간 간격은 일정하지 않습니다 (몇 초에서 며칠까지). 과거 이벤트가 계속 …

2
실제로 딥 러닝을 적용하는 병목 현상
딥 러닝 논문을 많이 읽은 후에는 네트워크보다 더 나은 성능을 얻기 위해 네트워크를 훈련시키는 데 많은 트릭이 있다는 느낌이 들었습니다. 산업 응용 프로그램 관점에서 볼 때 구글이나 페이스 북과 같은 대기업의 엘리트 연구 그룹을 제외하고 이러한 종류의 트릭을 개발하는 것은 매우 어렵습니다. 그렇다면 실제로 딥 러닝 알고리즘을 적용하는 가장 좋은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.