«deep-learning» 태그된 질문

데이터의 계층 적 표현을 학습하는 데 사용되는 기술과 관련된 새로운 기계 학습 연구 영역으로, 주로 심층 신경망 (즉, 둘 이상의 숨겨진 레이어가있는 네트워크)과 일종의 확률 적 그래픽 모델로 수행됩니다.


1
ReLU가 다른 활성화 기능보다 나은 이유
여기 에 대답은 sigmoid유사한 활성화 기능에 있었지만 소멸 Relu이 있으며 예상 값인 그라디언트 소멸 및 폭발을 나타냅니다 . 의 출력에는 제한이 없으므로 Relu예상 값이 0이 아닙니다. 나는 Relu그것 의 인기가 이전 tanh보다 머신 러닝 전문가들 사이에서 가장 인기있는 시간을 기억합니다 sigmoid. 그 이유는의 예상 값이 tanh0과 같았으며 신경망에서 더 깊은 …

3
심층 신경망에서의 배깅 대 드롭 아웃
배깅은 단일 예측 변수처럼 작동하는 여러 예측 변수를 생성하는 것입니다. 드롭 아웃은 모든 가능한 서브 네트워크를 평균화하도록 신경망에 가르치는 기술입니다. 가장 중요한 Kaggle의 경쟁을 살펴보면이 두 기술이 매우 자주 사용되는 것 같습니다. 실제 구현 외에 이론적 인 차이점을 볼 수 없습니다. 실제 응용 프로그램에서 왜 두 가지를 사용해야하는지 누가 설명 …

3
딥 러닝 모델을 훈련 할 때 미니 배치 메모리 영향을 계산하는 방법은 무엇입니까?
나는 안드레이 Karphaty에서이 노트를 기반으로 내 모델을 학습하기 위해 GPU에 의해 메모리에 필요한 양을 계산하기 위해 노력하고있어 : http://cs231n.github.io/convolutional-networks/#computational-considerations 내 네트워크에는 532,752 개의 활성화 와 19,072,984 개의 매개 변수 (가중치 및 바이어스)가 있습니다. 이들은 모두 32 비트 부동 소수점 값이므로 각각 4 바이트의 메모리를 사용합니다. 입력 이미지는 180x50x1 (너비 x …

5
seaborn 히트 맵을 더 크게 만들기
corr()원본 df 에서 df를 만듭니다 . corr()DF는 70 X 70에서 나와는 히트 맵을 시각화하는 것은 불가능합니다 ... sns.heatmap(df). 를 표시하려고 corr = df.corr()하면 테이블이 화면에 맞지 않으며 모든 상관 관계를 볼 수 있습니다. df크기에 관계없이 전체를 인쇄 하거나 히트 맵의 크기를 제어하는 ​​방법입니까?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

2
테스트 데이터에도 정규화를 적용해야합니까?
저자 식별 문제에 관한 프로젝트를하고 있습니다. 데이터를 훈련시키기 위해 tf-idf 정규화를 적용한 다음 해당 데이터에 대해 svm을 훈련했습니다. 이제 분류기를 사용할 때 테스트 데이터도 정규화해야합니다. 정규화의 기본 목표는 학습 알고리즘이 학습하는 동안 더 중요한 기능에 더 많은 가중치를 부여하는 것입니다. 일단 훈련을 마치면 어떤 기능이 중요하지 않은지 이미 알고 있습니다. …

5
컨볼 루션 신경망 과적 합. 도움이되지 않는 탈락
나는 convnets와 함께 조금 놀고 있습니다. 특히, 고양이 또는 개 (각 12500)로 표시된 25000 개의 이미지로 구성된 kaggle cats-vs-dogs 데이터 세트를 사용하고 있습니다. 테스트 세트에서 약 85 %의 분류 정확도를 달성했지만 90 %의 정확도 달성 목표를 설정했습니다. 내 주요 문제는 과적 합입니다. 어쨌든 항상 발생합니다 (일반적으로 8 ~ 10 일 …

3
Keras의 스트리밍 테스트 데이터에서 predict_generator로 예측을 얻는 방법은 무엇입니까?
에서 Keras 처음부터 훈련 convnets에 블로그 , 코드 쇼는 네트워크 교육 및 검증 데이터를 실행할 수 있습니다. 테스트 데이터는 어떻습니까? 유효성 검사 데이터가 테스트 데이터와 동일합니까? train 및 validation 폴더와 비슷한 줄에 별도의 테스트 폴더가있는 경우 테스트 데이터에 대한 혼동 행렬을 얻는 방법은 무엇입니까? 나는 이것을하기 위해 scikit learn 또는 …


2
회전 각도의 매개 변수화 회귀
화살표의 하향식 그림이 있고이 화살표가 이루는 각도를 예측하려고합니다. 이것은 도와 도 사이 또는 과 사이 입니다. 문제는이 목표가 원형이며 및 도가 정확히 동일하여 내 목표에 포함하려는 불균형이며 일반화에 크게 도움이되어야한다는 것입니다 (이것은 내 가정입니다). 문제는이 문제를 해결하는 깨끗한 방법이 보이지 않는다는 것입니다.이 문제 (또는 유사한 문제)를 해결하려고하는 논문이 있습니까? 잠재적 …

3
딥 러닝 모델에 새로운 카테고리를 추가하는 방법은 무엇입니까?
사전 훈련 된 네트워크에서 10 개의 객체를 인식하기 위해 전이 학습을 수행했다고 가정 해 보겠습니다. 내가 이미 훈련 한 10 가지 범주 나 원래 사전 훈련 된 모델의 정보를 모두 잃지 않고 네트워크가 분류 할 수있는 11 번째 항목을 어떻게 추가합니까? 친구가이 분야에서 활발한 연구가 진행되고 있다고 말했지만 관련 논문이나 …

1
PyTorch vs. Tensorflow 열망
Google은 최근에 tensorflow의 야간에 포함되어 tensorflow 계산 기능에 액세스하는 명령형 API 인 Eager 모드를 구축 합니다. tensorflow는 PyTorch와 어떻게 비교됩니까? 비교에 영향을 줄 수있는 몇 가지 측면은 다음과 같습니다. 정적 그래프 레거시 (예 : 노드의 이름)로 인해 열망의 장단점. 다른 것에는없는 본질적인 한계. 그 중 하나가 개선이 필요한 영역 (예 …

4
Generative Adversarial Networks로 거대한 데이터 세트를 생성 할 수 있습니까?
훈련을 위해 깊은 신경망에 공급할 충분한 데이터 세트 (이미지)를 찾을 수없는 문제를 처리하고 있습니다. Scott Reed et al.에 의해 출판 된 Generative Adversarial Text to Image Synthesis 논문에서 영감을 받았습니다 . 적대적 네트워크 생성. 사용 가능한 작은 데이터 집합을 GAN 모델에 대한 입력으로 사용하고 더 큰 네트워크 집합을 처리하기 위해 …

1
CNN의 입력으로 측면 이미지와 함께 비 이미지 기능을 추가하는 방법
안개 조건 (3 클래스)에서 이미지를 분류하기 위해 회선 신경 네트워크를 훈련하고 있습니다. 그러나 약 150.000 개의 이미지 각각에 대해 이미지 클래스를 예측하는 데 도움이되는 4 가지 기상 변수가 있습니다. 기존 CNN 구조에 기상 변수 (예 : 온도, 풍속)를 추가하여 분류에 도움을 줄 수있는 방법이 궁금했습니다. 내가 이미 생각할 수있는 한 …

3
ImageNet에 개인 클래스가 있습니까? 인간과 관련된 수업이 있습니까?
인터넷 에서 Imagenet 클래스에 대한 많은 출처 중 하나를 보면 인간과 관련된 단일 클래스를 찾을 수 없습니다 (그리고 수확업자 는 수확하는 사람이 아니지만 내가 아빠 longlegs, 일종의 일종이라고 알고 있습니다 거미 :-). 어떻게 가능합니까? 나는 적어도이 예상에있는 것 person조차 뭔가 더 구체적으로 다음과 같은 클래스를, 그리고 man, woman, toddler, 등 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.