세 문장 버전 :
각 레이어는 이전 레이어에 원하는 기능을 적용 할 수 있습니다 (보통 선형 변환 후 스쿼시 비선형 성).
숨겨진 레이어의 역할은 입력을 출력 레이어가 사용할 수있는 것으로 변환하는 것입니다.
출력 레이어는 숨겨진 레이어 활성화를 원하는 배율로 변환합니다.
당신이 5 인 것처럼 :
컴퓨터에 사진에 버스가 있는지 알려주려면 올바른 도구가 있으면 컴퓨터가 더 쉬울 수 있습니다.
따라서 버스 감지기는 휠 감지기 (차량을 알려주는 데 도움이 됨)와 상자 감지기 (버스가 큰 상자 모양이기 때문에)와 크기 감지기 (차가 너무 커서 말을 할 수 없음)로 구성 될 수 있습니다 ). 숨겨진 레이어의 세 가지 요소는 원시 이미지의 일부가 아니며 버스를 식별하는 데 도움이되는 도구입니다.
이 세 가지 감지기가 모두 켜져 있거나 (특히 작동중인 경우) 버스가있을 가능성이 높습니다.
신경망은 많은 검출기를 구축하고 조립하는 데 좋은 도구 (예 : 역 전파)가 있기 때문에 유용합니다.
당신이 성인 인 것처럼
피드 포워드 신경망은 일련의 기능을 데이터에 적용합니다. 정확한 함수는 사용중인 신경망에 따라 다릅니다. 가장 자주 함수는 이전 레이어의 선형 변환을 계산 한 다음 스쿼시 비선형 성을 계산합니다. 때로는 함수가 다른 기능을 수행 할 수도 있습니다 (예에서 논리 함수를 계산하거나 이미지의 인접 픽셀을 평균화하는 것과 같은). 따라서 다른 계층의 역할은 계산되는 함수에 따라 달라질 수 있지만 매우 일반적으로 노력하겠습니다.
입력 벡터 , 숨겨진 레이어 활성화 및 출력 활성화 호출 해 봅시다 . 에서 매핑되는 함수 와 에서 매핑되는 함수 가 있습니다 . xhyfxhghy
따라서 숨겨진 계층의 활성화는 이며 네트워크의 출력은 입니다.f(x)g(f(x))
왜 하나가 아닌 두 개의 함수 ( 및 )가 있습니까?fg
함수 당 복잡성의 수준이 제한되면 는 와 가 개별적으로 할 수없는 것을 계산할 수 있습니다. g(f(x))fg
논리 함수를 사용한 예 :
예를 들어, 와 가 "AND", "OR"및 "NAND"와 같은 간단한 논리 연산자 만 허용 하면 "XOR"과 같은 다른 함수는 그 중 하나만 사용하여 계산할 수 없습니다. 다른 한편으로, 우리 는 이 함수들을 서로 겹쳐서 기꺼이한다면 "XOR"을 계산할 수 있습니다 :fg
첫 번째 레이어 기능 :
- 하나 이상의 요소가 "TRUE"인지 확인하십시오 (OR 사용).
- 모두 "참"이 아닌지 확인하십시오 (NAND 사용).
두번째 층 기능 :
- 첫 번째 계층 기준이 모두 만족되는지 확인하십시오 (AND 사용).
네트워크의 출력은이 두 번째 기능의 결과 일뿐입니다. 첫 번째 계층 은 전체 네트워크가 XOR을 수행 할 수 있도록 입력 을 두 번째 계층이 사용할 수있는 것으로 변환합니다 .
이미지가 포함 된 예 :
이 대화의 슬라이드 61 ( 여기서는 단일 이미지로도 제공됨 )은 특정 신경망에서 서로 다른 숨겨진 레이어가 찾고있는 것을 보여줍니다 (한 가지 방법으로 시각화).
첫 번째 레이어는 이미지에서 짧은 가장자리를 찾습니다. 이것은 원시 픽셀 데이터에서 찾기가 쉽지만 얼굴이나 버스 또는 코끼리를보고 있는지 여부를 알려주는 데는별로 유용하지 않습니다. .
다음 레이어는 가장자리를 구성합니다. 아래쪽 숨겨진 레이어의 가장자리가 특정 방식으로 서로 맞으면 가장 왼쪽 열의 중앙에있는 눈 탐지기 중 하나가 켜질 수 있습니다. 미가공 픽셀에서 특정한 것을 찾는 데 아주 좋은 단일 레이어를 만드는 것은 어려울 것입니다. 눈 탐지기는 미가공 픽셀보다 가장자리 탐지기보다 훨씬 쉽게 구축 할 수 있습니다.
다음 층은 눈 탐지기와 코 탐지기를 얼굴로 구성합니다. 다시 말해, 이전 레이어의 눈 탐지기와 코 탐지기가 올바른 패턴으로 켜지면 불이 켜집니다. 이들은 특정 종류의면을 찾는 데 매우 적합합니다. 하나 이상의면이 켜지면 출력 레이어에면이 있다고보고해야합니다.
얼굴 탐지기는 눈 탐지기와 코 탐지기에서 쉽게 구축 할 수 있지만 픽셀 강도로 만들기는 어렵 기 때문에 유용합니다 .
따라서 각 레이어는 원시 픽셀에서 멀어지고 궁극적 인 목표 (예 : 얼굴 감지 또는 버스 감지)에 더 가깝습니다.
여러 다른 질문에 대한 답변
"입력 레이어의 일부 레이어가 숨겨진 레이어에 연결된 이유는 무엇입니까?"
네트워크에서 연결이 끊어진 노드를 "바이어스"노드라고합니다. 여기에 정말 좋은 설명이 있습니다 . 짧은 대답은 회귀의 절편 항과 같다는 것입니다.
"이미지 예의"눈 감지기 "사진은 어디에서 왔습니까?"
필자는 연결된 특정 이미지를 다시 확인하지 않았지만 일반적으로 이러한 시각화는 해당 뉴런의 활동을 최대화하는 입력 레이어의 픽셀 집합을 보여줍니다. 우리가 뉴런을 눈 탐지기로 생각한다면, 이것은 뉴런이 가장 눈과 같은 것으로 간주하는 이미지입니다. 사람들은 일반적으로 최적화 (hill-climbing) 절차를 통해 이러한 픽셀 세트를 찾습니다.
에서 이 논문 세계 최대의 신경 그물의 하나 일부 Google 사람들에 의해, 그들은 "얼굴 검출"신경과 "고양이 검출기"신경이 방법뿐만 아니라 두 번째 방법을 보여 그들은 또한 보여 실제 이미지 을 활성화 뉴런이 가장 강력합니다 (그림 3, 그림 16). 두 번째 접근 방식은 네트워크가 얼마나 유연하고 비선형적인지를 보여주기 때문에 좋습니다. 이러한 높은 수준의 "검출기"는 픽셀 수준에서 특별히 유사하지는 않지만 모든 이미지에 민감합니다.
불분명하거나 더 궁금한 점이 있으면 알려주세요.