기계 학습의 맥락에서 차이점은 무엇입니까?
- 비지도 학습
- 지도 학습 및
- 반지도 학습?
그리고 살펴볼 주요 알고리즘 접근법은 무엇입니까?
기계 학습의 맥락에서 차이점은 무엇입니까?
그리고 살펴볼 주요 알고리즘 접근법은 무엇입니까?
답변:
일반적으로 기계 학습의 문제는 분류, 예측 또는 모델링을위한 함수 추정의 변형으로 간주 될 수 있습니다.
지도 학습 에서는 입력 ( , , ...,) 및 출력 ( , , ...,)이 제공되며 일반화 방식으로이 동작과 유사한 기능을 찾는 데 어려움을 겪습니다. 결과는 클래스 레이블 (분류) 또는 실수 (회귀) 일 수 있습니다. 이것은 감독 학습의 "감독"입니다.
반 감독 학습 에는 레이블이있는 데이터와 레이블이없는 데이터에 대한 함수 추정이 포함됩니다. 레이블이없는 데이터는 일반적으로 생성되지 않지만 레이블이있는 데이터는 종종 생성하는 데 비용이 많이 들기 때문에 이러한 접근 방식이 동기가됩니다. 여기서 해결해야 할 과제는 이러한 방식으로 혼합 된 데이터를 처리하는 방법에 대한 기술적 문제입니다. 반 감독 학습 방법에 대한 자세한 내용 은이 반 감독 학습 문학 설문 조사 를 참조하십시오.
비지도 학습
비지도 학습은 교육에 사용할 수있는 레이블이있는 데이터가 없을 때입니다. 이것의 예는 종종 클러스터링 방법입니다.
지도 학습
이 경우 교육 데이터에 레이블이 지정된 데이터가 없습니다. 여기서 해결해야 할 문제는 종종 레이블이없는 데이터 포인트의 레이블을 예측하는 것입니다.
반 감독 학습
이 경우 레이블이있는 데이터와 레이블이없는 데이터가 모두 사용됩니다. 예를 들어, 일부 계층은 데이터의 구조를 학습하고 (비 관리) 한 계층은 분류를 수행하는 데 사용되는 심층 네트워크에서 사용될 수 있습니다 (관리되는 데이터로 훈련).
감독 / 감독되지 않는 것이 최선의 방법이라고 생각하지 않습니다. 기본 데이터 마이닝의 경우 수행하려는 작업에 대해 생각하는 것이 좋습니다. 네 가지 주요 작업이 있습니다.
예측. 실수를 예측하는 경우이를 회귀라고합니다. 정수 또는 클래스를 예측하는 경우이를 분류라고합니다.
모델링. 모델링은 예측과 동일하지만 모델은 인간이 이해할 수 있습니다. 신경망과 서포트 벡터 머신은 훌륭하게 작동하지만 이해하기 쉬운 모델을 생성하지는 않습니다 [1]. 의사 결정 트리 및 클래식 선형 회귀는 이해하기 쉬운 모델의 예입니다.
유사성. 자연스러운 속성 그룹을 찾으려고하는 경우이를 요인 분석이라고합니다. 자연스러운 관측 그룹을 찾으려면 클러스터링이라고합니다.
협회. 상관 관계와 비슷하지만 막대한 이진 데이터 집합의 경우입니다.
[1] 분명히 골드만 삭스 (Goldman Sachs)는 예측을 위해 엄청난 양의 신경망을 만들었지 만 아무도 그것을 이해하지 못했기 때문에 신경망을 설명하기 위해 다른 프로그램을 작성해야했습니다.