클러스터링 방법을 이해하려고합니다.
내가 이해 한 것 II :
지도 학습에서 범주 / 라벨 데이터는 계산 전에 알려집니다. 따라서 레이블, 클래스 또는 범주는 해당 클러스터에 실제로 중요한 매개 변수를 "학습"하기 위해 사용됩니다.
비지도 학습에서 데이터 집합은 군집을 알지 않고도 세그먼트에 할당됩니다.
그것은 어떤 파라미터가 세분화에 중요한지조차 모른다면,지도 학습을 선호해야한다는 것을 의미합니까?
클러스터링 방법을 이해하려고합니다.
내가 이해 한 것 II :
지도 학습에서 범주 / 라벨 데이터는 계산 전에 알려집니다. 따라서 레이블, 클래스 또는 범주는 해당 클러스터에 실제로 중요한 매개 변수를 "학습"하기 위해 사용됩니다.
비지도 학습에서 데이터 집합은 군집을 알지 않고도 세그먼트에 할당됩니다.
그것은 어떤 파라미터가 세분화에 중요한지조차 모른다면,지도 학습을 선호해야한다는 것을 의미합니까?
답변:
차이점은지도 학습에서 "범주", "클래스"또는 "라벨"이 알려져 있다는 것입니다. 비지도 학습에서는 그렇지 않으며 학습 과정에서 적절한 "범주"를 찾습니다. 두 종류의 학습에서 분류를 수행하기에 가장 적합한 것을 결정하기 위해 모든 매개 변수가 고려됩니다.
감독 또는 비 감독을 선택했는지 여부는 데이터의 "범주"가 무엇인지 알고 있는지 여부에 따라 결정되어야합니다. 알고 있다면지도 학습을 사용하십시오. 모르는 경우 감독되지 않은 상태로 사용하십시오.
많은 매개 변수가 있고 어떤 매개 변수가 관련되어 있는지 알지 못하는 경우 기본 구성 요소 분석 과 같은 것을 사용하여 관련 매개 변수 를 결정할 수 있습니다.
감독 수준은 2도 이상입니다. 예를 들어, 구조적 발견 패러다임의 감독되지 않고 지식이없는 자연어 처리에 관한 Christian Biemann 박사 논문, 24-25 페이지 (6-7) , 2007 페이지를 참조하십시오.
이 논문은 감독, 반 감독, 약한 감독, 감독되지 않은 4 가지 정도를 식별하고 자연 언어 처리 환경에서 차이점을 설명합니다. 관련 정의는 다음과 같습니다.