«deep-learning» 태그된 질문

데이터의 계층 적 표현 학습과 관련된 머신 러닝 영역은 주로 심층 신경망을 사용하여 수행됩니다.

2
Keras : val_loss가 증가하는 동안 손실이 감소하는 이유는 무엇입니까?
나는 많은 매개 변수에 대한 그리드 검색을 설정했습니다. 이진 분류를 수행하는 Keras 신경망에 가장 적합한 매개 변수를 찾으려고합니다. 출력은 1 또는 0입니다. 약 200 개의 기능이 있습니다. 그리드 검색을 수행했을 때 많은 모델과 매개 변수를 얻었습니다. 가장 좋은 모델에는 다음과 같은 매개 변수가 있습니다. Epochs : 20 Batch Size : …


1
딥 러닝의 딥 레지던트 네트워크와 관련하여 레거시 학습 블록은 정확히 무엇입니까?
나는 이미지 인식을위한 딥 레지던트 학습 (Deep Residual Learning)을 읽고 있었고, 잔차 블록이 계산적으로 수반하는 것을 100 % 확실하게 이해하는 데 어려움을 겪었습니다. 그들의 논문을 읽고 그들은 그림 2를 가지고 있습니다. Residual Block이 무엇을 의미하는지 보여줍니다. 잔차 블록의 계산은 단순히 다음과 같습니다. y =σ( W2σ( W1x + b1) + b2+ …

2
머신 러닝에서 Pearson의 상관 계수를 최적화 목표로 사용
기계 학습 (회귀 문제의 경우)에서 나는 종종 평균 제곱 오차 (MSE) 또는 평균 절대 오차 (MAE)가 최소화하기 위해 오류 함수로 사용됩니다 (정규화 항). 상관 계수를 사용하는 것이 더 적합한 상황이 있는지 궁금합니다. 이러한 상황이 존재하면 다음을 수행하십시오. 어떤 상황에서 상관 계수가 MSE / MAE에 비해 더 나은 지표입니까? 이러한 상황에서 …

3
신경망에 대한 인코딩 날짜 / 시간 (순환 데이터)
신경망의 이벤트 날짜와 시간을 어떻게 인코딩합니까? 연속 시계열이 없지만 날짜 및 시간이있는 일부 이벤트가 있으며 관심 분야를 분석합니다. 이 관심사는 아침과 저녁에 차이가 있으며 주중, 여름과 겨울, 크리스마스와 부활절 전과는 다릅니다. 그리고 이벤트 자체는 시간이 지남에 따라 강력한 불균일 한 분포를 가지고 있습니다 (주간에 더 많은 종류, 밤에 더 많은 …

3
신경망을 그래픽 모델로 수학적으로 모델링
신경망과 그래픽 모델을 수학적으로 연결하는 데 어려움을 겪고 있습니다. 그래픽 모델에서 아이디어는 간단합니다. 확률 분포는 그래프의 기울기에 따라 인수 분해되며, 일반적으로 전위는 지수 계열입니다. 신경망에 대한 동등한 추론이 있습니까? Restricted Boltzmann 기계 또는 CNN의 단위 (변수)에 대한 확률 분포를 에너지 또는 단위 간 에너지의 곱으로 나타낼 수 있습니까? 또한 확률 …

2
CNN에서 필터 크기, 보폭 등을 선택합니까?
스탠포드의 CS231N 강의를보고 있었고 CNN 아키텍처의 일부 문제를 해결하려고 노력하고 있습니다. 내가 이해하려고하는 것은 컨볼 루션 필터 크기와 보폭과 같은 것들을 선택하기위한 일반적인 지침이 있거나 이것이 과학보다 예술입니까? 풀링은 주로 어떤 형태의 번역 불일치를 모델로 유도하기 위해 존재한다는 것을 이해합니다. 반면에, 보폭이 어떻게 선택되는지에 대한 좋은 직감이 없습니다. 현재 레이어 …



3
컨볼 루션 뉴럴 네트워크에서 최종 Softmax 레이어 이전의 비선형 성
나는 회선 신경망을 연구하고 구현하려고 노력하고 있지만이 질문이 일반적으로 다층 퍼셉트론에 적용되는 것으로 가정합니다. 내 네트워크의 출력 뉴런은 각 클래스의 활성화를 나타냅니다. 가장 활동적인 뉴런은 주어진 입력에 대해 예측 된 클래스에 해당합니다. 훈련에 대한 교차 엔트로피 비용을 고려하기 위해 네트워크의 끝에 softmax 레이어를 추가하여 각 뉴런의 활성화 값이 확률 값으로 …




1
손실 함수의 2 차 근사 (딥 러닝 북, 7.33)
딥 러닝에 관한 Goodfellow (2016)의 저서에서 그는 L2 정규화 ( https://www.deeplearningbook.org/contents/regularization.html 247 쪽) 의 조기 중지와 동등한 내용에 대해 이야기했습니다 . 비용 함수 의 2 차 근사값 은 다음과 같습니다.jjj 제이^( θ ) = J( 승※) + 12( w − w※)티H( w − w※)J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) 여기서 는 헤 시안 행렬입니다 (식 …

4
가능성이없는 추론-무슨 뜻입니까?
최근에 나는 문헌에서 '무우 행 (freelihood-free)'방법이 사용되는 것을 알고있다. 그러나 나는 그것이 될 추론 또는 최적화 방법에 대해 무엇을 의미하는지에 취소하고 있지 않다 가능성이없는 . 기계 학습에서 목표는 보통 신경망의 가중치와 같은 기능에 맞는 일부 매개 변수의 가능성을 최대화하는 것입니다. 그렇다면 가능성이없는 접근법 의 철학은 정확히 무엇이며 GAN과 같은 적대적인 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.