«neural-network» 태그된 질문

인공 신경 네트워크 (ANN)는 생물학적 뉴런의 특성을 모방하는 프로그래밍 뉴런으로 구성된 '뉴런'으로 구성됩니다. 뉴런 사이의 가중 연결 세트는 네트워크 디자이너가 실제 시스템의 모델을 가지고 있지 않아도 인공 지능 문제를 해결하기 위해 정보가 네트워크를 통해 전파되도록합니다.

3
딥 러닝 모델에 새로운 카테고리를 추가하는 방법은 무엇입니까?
사전 훈련 된 네트워크에서 10 개의 객체를 인식하기 위해 전이 학습을 수행했다고 가정 해 보겠습니다. 내가 이미 훈련 한 10 가지 범주 나 원래 사전 훈련 된 모델의 정보를 모두 잃지 않고 네트워크가 분류 할 수있는 11 번째 항목을 어떻게 추가합니까? 친구가이 분야에서 활발한 연구가 진행되고 있다고 말했지만 관련 논문이나 …

1
신경망에서의 활성화 기능의 차이
신경망의 활성화 기능 유형을 연구했습니다. 함수 자체는 매우 간단하지만 응용 프로그램의 차이점은 명확하지 않습니다. 원하는 이진 / 연속 출력에 따라 논리 함수와 선형 함수를 구별하는 것이 합리적이지만 단순 선형 함수에 비해 시그 모이 드 함수의 장점은 무엇입니까? ReLU는 나를 위해 특히 이해하기 어렵습니다. 예를 들어 양의 입력의 경우 선형처럼 동작하지만 …

3
단어 기반 및 문자 기반 텍스트 생성 RNN의 차이점은 무엇입니까?
Recurrent Neural Networks로 텍스트 생성에 대해 읽는 동안 실제로 단어를 말하지 않고 문자별로 단어 를 생성 하고 문자별로 문자 를 생성하기 위해 일부 예가 구현되었음을 알았습니다 . 그래서, 텍스트를 예측 RNN 모델 사이의 차이가 무엇 단어 당 기준 및 텍스트 예측 사람 당 문자 근거는? 단어 기반 RNN이 더 큰 …

2
활성화 기능이 단조로운 이유는 무엇입니까?
현재 신경망 시험을 준비 중입니다. 이전 시험의 여러 프로토콜에서 (다층 퍼셉트론에서) 뉴런의 활성화 기능이 단조로워 야한다는 것을 읽었습니다. 활성화 함수는 미분 가능해야하며, 대부분의 점에서 0이 아닌 미분이어야하며 비선형이어야합니다. 왜 단조로운 것이 중요하고 도움이되는지 이해하지 못합니다. 다음과 같은 활성화 기능을 알고 있으며 단조로운 기능입니다. RELU 시그 모이 드 탄 Softmax : …

1
CNN의 입력으로 측면 이미지와 함께 비 이미지 기능을 추가하는 방법
안개 조건 (3 클래스)에서 이미지를 분류하기 위해 회선 신경 네트워크를 훈련하고 있습니다. 그러나 약 150.000 개의 이미지 각각에 대해 이미지 클래스를 예측하는 데 도움이되는 4 가지 기상 변수가 있습니다. 기존 CNN 구조에 기상 변수 (예 : 온도, 풍속)를 추가하여 분류에 도움을 줄 수있는 방법이 궁금했습니다. 내가 이미 생각할 수있는 한 …

1
최대 풀링 계층을 통한 역 전파
이 질문에 대한 작은 하위 질문 이 있습니다. 최대 풀링 레이어를 통해 역 전파 할 때 최대로 선택된 이전 레이어의 뉴런이 모든 그라디언트를 얻는 방식으로 그라디언트가 다시 라우팅됩니다. 100 % 확실하지 않은 것은 다음 레이어의 그라디언트가 풀링 레이어로 다시 라우팅되는 방식입니다. 첫 번째 질문은 풀링 레이어가 아래 이미지와 같이 완전히 …


3
Max Pooling이 이미지를 다운 샘플링하려고하면 왜 복잡합니까?
가장자리 식별과 같은 작업을 수행하기 위해 필터를 적용한다는 아이디어는 매우 멋진 아이디어입니다. 예를 들어, 7의 이미지를 찍을 수 있습니다. 일부 필터를 사용하면 원래 이미지의 다른 특성을 강조하는 변환 된 이미지로 끝날 수 있습니다. 원본 7 : 네트워크는 다음과 같이 경험할 수 있습니다. 각 이미지가 원본 7의 다른 가장자리를 어떻게 추출했는지 …


3
Keras의 model.predict 함수 출력은 무엇을 의미합니까?
Quora 공식 데이터 세트에서 중복 질문을 예측하기 위해 LSTM 모델을 만들었습니다. 테스트 레이블은 0 또는 1입니다. 1은 질문 쌍이 중복되었음을 나타냅니다. 를 사용하여 모델을 빌드 한 후 테스트 데이터를 model.fit사용하여 모델을 model.predict테스트합니다. 출력은 아래와 같은 값의 배열입니다. [ 0.00514298] [ 0.15161049] [ 0.27588326] [ 0.00236167] [ 1.80067325] [ 0.01048524] [ …

2
신경망 최적화에 유전자 알고리즘이 사용되지 않는 이유는 무엇입니까?
내가 이해 한 바에 따르면, 유전자 알고리즘은 다목적 최적화를위한 강력한 도구입니다. 또한 신경망 (특히 신경망)을 훈련하는 것은 어렵고 많은 문제 (볼록하지 않은 비용 함수-로컬 최소, 사라짐 및 폭발 그라디언트 등)가 있습니다. 또한 GA로 개념적으로 NN을 교육하는 것이 가능합니다. 나는 그들이 왜 실제로 사용되지 않는지 궁금했다. 성능 문제입니까?



2
심층 신경망 훈련 시각화
훈련 중에 가중치를 플롯하기 위해 멀티 레이어 네트워크에 해당하는 Hinton Diagrams를 찾으려고합니다. 훈련 된 네트워크는 Deep SRN과 다소 유사합니다. 즉, 여러 개의 힌튼 다이어그램의 동시 플롯을 시각적으로 혼란스럽게 만드는 다중 가중치 매트릭스가 많이 있습니다. 누구나 여러 계층의 반복 네트워크에 대한 가중치 업데이트 프로세스를 시각화하는 좋은 방법을 알고 있습니까? 주제에 관한 …

3
치수 축소를위한 자동 엔코더가 대칭 인 이유는 무엇입니까?
나는 자동 엔코더 또는 신경망의 전문가가 아니므로 어리석은 질문이라면 용서하십시오. 차원 축소 또는 고차원 데이터에서 클러스터 시각화를 위해 자동 엔코더를 사용하여 2 개의 노드로 네트워크 계층의 출력을 검사하여 (손실) 2 차원 표현을 만들 수 있습니다. 예를 들어 다음 아키텍처를 사용하면 세 번째 레이어의 출력을 검사합니다. [X]→N1=100→N2=25→(N3=2)→N4=25→N5=100→[X][X]→N1=100→N2=25→(N3=2)→N4=25→N5=100→[X][X] \rightarrow N_1=100 \rightarrow N_2=25 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.