나는 신경망을 처음 접했고 신경망이 분류 문제에 그렇게 좋은 이유를 수학적으로 이해하려고합니다.
작은 신경망의 예를 들자면 (예를 들어, 입력 2 개, 숨겨진 레이어에 2 개 노드, 출력에 2 개 노드), 선형 조합을 통해 대부분 시그 모이 드 출력에 복잡한 기능 만 있으면됩니다 S 자형의.
그렇다면 어떻게 예측을 잘할 수 있습니까? 최종 함수가 일종의 커브 피팅으로 이어 집니까?
나는 신경망을 처음 접했고 신경망이 분류 문제에 그렇게 좋은 이유를 수학적으로 이해하려고합니다.
작은 신경망의 예를 들자면 (예를 들어, 입력 2 개, 숨겨진 레이어에 2 개 노드, 출력에 2 개 노드), 선형 조합을 통해 대부분 시그 모이 드 출력에 복잡한 기능 만 있으면됩니다 S 자형의.
그렇다면 어떻게 예측을 잘할 수 있습니까? 최종 함수가 일종의 커브 피팅으로 이어 집니까?
답변:
신경망을 사용하면 단순히 데이터를 분류 할 수 있습니다. 올바르게 분류하면 나중에 분류 할 수 있습니다.
작동 원리
Perceptron과 같은 간단한 신경망 은 데이터를 분류하기 위해 하나의 결정 경계를 그릴 수 있습니다 .
예를 들어 간단한 신경망으로 간단한 AND 문제를 해결한다고 가정합니다. x1과 x2를 포함하는 4 개의 샘플 데이터와 w1과 w2를 포함하는 가중치 벡터가 있습니다. 초기 가중치 벡터가 [0 0]이라고 가정하십시오. NN 알고리즘에 따라 계산 한 경우. 마지막에는 가중치 벡터 [1 1] 또는 이와 유사한 것이 있어야합니다.
그래픽에 집중하십시오.
입력 값을 두 개의 클래스 (0과 1)로 분류 할 수 있습니다. 확인. 그러면 어떻게해야합니까? 너무 간단합니다. 첫 번째 합계 입력 값 (x1 및 x2).
0 + 0 = 0
0 + 1 = 1
1 + 0 = 1
1 + 1 = 2
그것은 말한다 :
sum <1.5이면 클래스는 0입니다
sum> 1.5이면 클래스는 1입니다.
신경망은 다양한 작업에서 뛰어나지 만, 왜 정확한지 이해하려면 분류와 같은 특정 작업을보다 쉽게 수행하고 더 깊이 잠수 할 수 있습니다.
간단히 말해서 기계 학습 기술은 과거 예제에 따라 특정 입력이 속하는 클래스를 예측하는 함수를 학습합니다. 신경망을 차별화하는 것은 데이터의 복잡한 패턴까지도 설명 할 수있는 이러한 함수를 구성 할 수있는 능력입니다. 신경망의 핵심은 Relu와 같은 활성화 기능으로 다음과 같은 몇 가지 기본 분류 경계를 그릴 수 있습니다.
신경망은 수백 개의 이러한 Relus를 함께 구성함으로써 다음과 같이 임의로 복잡한 분류 경계를 만들 수 있습니다.
무슨 일이 신경 네트워크 작업을하게 뒤에이 글에서 필자는 직관을 설명하려고 : https://medium.com/machine-intelligence-report/how-do-neural-networks-work-57d1ab5337ce