지도 학습과 비지도 학습의 차이점은 정확히 무엇입니까?


28

클러스터링 방법을 이해하려고합니다.

내가 이해 한 것 II :

  1. 지도 학습에서 범주 / 라벨 데이터는 계산 전에 알려집니다. 따라서 레이블, 클래스 또는 범주는 해당 클러스터에 실제로 중요한 매개 변수를 "학습"하기 위해 사용됩니다.

  2. 비지도 학습에서 데이터 집합은 군집을 알지 않고도 세그먼트에 할당됩니다.

그것은 어떤 파라미터가 세분화에 중요한지조차 모른다면,지도 학습을 선호해야한다는 것을 의미합니까?


2
클러스터링 만이 감독되지 않은 학습 유형은 아닙니다.
George

1
레이블이있는 교육 데이터를 사용할 수있는 경우지도 학습이 선호됩니다. 감독 또는 감독되지 않은 방법을 사용하여 데이터를 분할 할 수 있습니다. 가장 큰 차이점은 감독 설정에서 훈련 데이터에 대한 CORRECT 세분화를 알고 있다는 것입니다.
Nick

답변:


23

차이점은지도 학습에서 "범주", "클래스"또는 "라벨"이 알려져 있다는 것입니다. 비지도 학습에서는 그렇지 않으며 학습 과정에서 적절한 "범주"를 찾습니다. 두 종류의 학습에서 분류를 수행하기에 가장 적합한 것을 결정하기 위해 모든 매개 변수가 고려됩니다.

감독 또는 비 감독을 선택했는지 여부는 데이터의 "범주"가 무엇인지 알고 있는지 여부에 따라 결정되어야합니다. 알고 있다면지도 학습을 사용하십시오. 모르는 경우 감독되지 않은 상태로 사용하십시오.

많은 매개 변수가 있고 어떤 매개 변수가 관련되어 있는지 알지 못하는 경우 기본 구성 요소 분석 과 같은 것을 사용하여 관련 매개 변수 를 결정할 수 있습니다.


13

감독 수준은 2도 이상입니다. 예를 들어, 구조적 발견 패러다임의 감독되지 않고 지식이없는 자연어 처리에 관한 Christian Biemann 박사 논문, 24-25 페이지 (6-7) , 2007 페이지를 참조하십시오.

이 논문은 감독, 반 감독, 약한 감독, 감독되지 않은 4 가지 정도를 식별하고 자연 언어 처리 환경에서 차이점을 설명합니다. 관련 정의는 다음과 같습니다.

  • 에서 감독 시스템, 기계 학습 알고리즘에 제시된 데이터가 완전히 표시됩니다. 즉, 모든 예에는 기계가 재현해야 할 분류가 표시됩니다. 이를 위해 분류자는 데이터에서 배우고 아직 보이지 않는 인스턴스에 레이블을 할당하는 프로세스를 분류라고합니다.
  • 에서는 반 관리 대상 시스템, 기계는 별도로 고려 표지 된 데이터를 취할 수있다. 더 큰 데이터 기반으로 인해 반 감독 시스템은 동일한 레이블이 지정된 예제를 사용하여 감독 된 시스템보다 성능이 뛰어납니다. 이러한 개선의 이유는 레이블이없는 데이터가 많을수록 시스템이 데이터의 고유 구조를보다 정확하게 모델링 할 수 있기 때문입니다.
  • 자체 교육이라고도하는 부트 스트랩은 훨씬 적은 교육 예제를 사용하도록 설계된 학습 형태이므로 약한 감독 이라고도 합니다. 부트 스트랩은 몇 가지 교육 예제로 시작하고 분류자를 훈련 시키며 재교육을 위해이 분류자가 얻은 긍정적 인 예를 사용합니다. 학습 예제 세트가 커짐에 따라 분류 예제가 향상됩니다. 부정적인 예제가 너무 많지 않아 긍정적으로 잘못 분류되어 성능이 저하 될 수 있습니다.
  • 감독 되지 않은 시스템에는 교육 예제가 전혀 제공되지 않으며 클러스터링이 수행됩니다. 이것은 데이터 인스턴스를 여러 그룹으로 나누는 것입니다. 클러스터링 알고리즘의 결과는 데이터 중심이므로 더 자연스럽고 데이터의 기본 구조에 더 적합합니다. 이 장점은 또한 주요 결점입니다. 기계에 무엇을해야할지 (분류에서와 같이) 알릴 수 없다면, 클러스터링 결과의 품질을 결정적인 방식으로 판단하기가 어렵습니다. 그러나 훈련 예제 준비가 없으면 감독되지 않은 패러다임이 매우 매력적입니다.

0

지도 학습에서 수업은 사전에 알려져 있으며, 예를 들어 2 개의 수업이 좋고 나쁜 고객입니다. 새 객체 (고객)가 해당 속성을 기반으로하는 경우 고객을 불량 또는 우수 고객 등급에 할당 할 수 있습니다.

감독되지 않은 학습에서 그룹 / 클래스가 아직 알려지지 않았으므로 객체 (고객)가 있으므로 유사한 구매 습관을 가진 고객을 그룹화하여 다른 그룹이 고객으로 구성됩니다.


0

지도 학습에서 출력 (종속 변수)은 입력 변수 (독립 변수)에 따라 달라집니다. 주어진 감독 세트에서 응답자는 원하는 목표를 계산하려고합니다.

비지도 학습에는 감독이 없으므로 시스템은 상황에 적응하고 일부 측정에 따라 수동으로 학습합니다.

예 : 수업에서 교사-감독-지도 학습 수업에서 선택 과목 자체 감독-비지도 감독되지 않은 학습

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.