지도 학습
- 1) 인간은 입력 및 출력 데이터를 기반으로 분류기를 작성합니다.
- 2) 해당 분류기는 훈련 데이터 세트로 훈련됩니다.
- 3) 해당 분류기는 테스트 데이터 세트로 테스트됩니다.
- 4) 출력 이 만족스러운 경우 배포
"이 데이터를 분류하는 방법을 알고 있습니다. 분류 도구를 사용하려면 정렬해야합니다."
방법의 포인트 : 레이블을 분류하거나 실수를 생성하는 방법
비지도 학습
- 1) 인간은 입력 데이터를 기반으로 알고리즘을 구축
- 2) 해당 알고리즘은 테스트 데이터 세트로 테스트됩니다 (알고리즘이 분류자를 작성 함).
- 3) 분류 기가 만족스러운 경우 배포
"이 데이터를 분류하는 방법을 모르겠습니다. 알고리즘이 나를 위해 분류자를 만들 수 있습니까?"
방법의 포인트 : 클래스 레이블 또는 예측 (PDF)
강화 학습
- 1) 인간은 입력 데이터를 기반으로 알고리즘을 구축
- 2) 해당 알고리즘 은 사용자 가 알고리즘이 취한 조치 를 통해 알고리즘을 보상하거나 처벌하는 입력 데이터에 의존 하는 상태를 나타냅니다.
- 3) 그 알고리즘은 보상 / 처벌에서 배우고 자체적으로 업데이트됩니다.
- 4) 항상 생산 중이며 국가의 조치를 제시 할 수 있도록 실제 데이터를 배워야합니다.
"이 데이터를 분류하는 방법을 모르겠습니다.이 데이터를 분류 할 수 있습니까? 만약 그것이 정확하다면 보상을 드릴 것입니다. 그렇지 않다면 당신을 처벌 할 것입니다."
이러한 관행의 흐름의 종류인가, 나는 그들이하는 일에 대해 많이 듣고 있지만, 실제 와 예시적인 정보는 섬뜩 작은!