지도 학습과 비지도 학습의 차이점은 무엇입니까? [닫은]


283

인공 지능과 머신 러닝의 관점에서지도 학습과 비지도 학습의 차이점은 무엇입니까? 예를 들어 기본적이고 쉬운 설명을 제공 할 수 있습니까?

답변:


501

이 기본적인 질문을하므로 Machine Learning 자체를 지정하는 것이 좋습니다.

머신 러닝은 데이터 중심의 알고리즘 클래스입니다. 즉 "일반"알고리즘과 달리 "좋은 답변"이 무엇인지 "알려주는"데이터입니다. 예 : 이미지에서 얼굴 감지를위한 가상의 비 기계 학습 알고리즘은 얼굴이 무엇인지 (피부와 같은 디스크, 눈이 예상되는 어두운 영역)를 정의하려고 시도합니다. 머신 러닝 알고리즘은 그러한 코드화 된 정의를 갖지 않지만 "예제로 학습"할 것입니다 : 얼굴과 얼굴이 아닌 여러 이미지를 보여 주면 좋은 알고리즘이 결국에는 보이지 않는지를 배우고 예측할 수 있습니다 이미지는 얼굴입니다.

이 특정 얼굴 감지 예는 감독됩니다 . 즉, 예에 레이블을 지정 해야 하거나 어떤 얼굴이 아닌 얼굴을 명시 적으로 말해야합니다.

에서 자율 당신의 예제가되지 않는 알고리즘 표시 , 당신은 아무 말도하지 않습니다 즉. 물론 이러한 경우 알고리즘 자체는 얼굴을 "발명"할 수 없지만 데이터를 다른 그룹으로 클러스터링 하려고 시도 할 수 있습니다 . 예를 들어 얼굴이 말과는 매우 다른 풍경과 매우 다르다는 것을 구별 할 수 있습니다.

또 다른 답변이 그것을 언급하고 있기 때문에 (잘못된 방식으로) : "중급"형태의 감독, 즉 반 감독 적이고 적극적인 학습이 있습니다. 엄밀히 말하면이 방법은 많은 수의 레이블이 지정된 예제를 피하는 "스마트 한"방법이있는 감독 방법입니다. 적극적인 학습에서 알고리즘 자체는 레이블을 지정할 항목을 결정합니다 (예 : 풍경과 말에 대해 확신 할 수 있지만 고릴라가 실제로 얼굴 그림인지 확인하도록 요청할 수 있음). semi-supervised learning에는 레이블이있는 예제로 시작하여 레이블이없는 많은 데이터에 대해 생각하는 방식을 서로 "알려주는"두 가지 알고리즘이 있습니다. 이 "토론"에서 그들은 배운다.


@ChuckTesta 아니오, 이것은 완전히 다릅니다. 온라인 능동 학습에 대한 연구도 찾을 수 있습니다.
shn

@ChuckTesta Active Learning은 온라인 학습의 하위 집합입니다. 온라인 학습의 경우, 알고리즘은 전체 학습에서 전체 데이터 세트를 학습하는 배치 학습과 달리 순차적 인 순서 (스트림)로 데이터를 수신합니다. 또한, 능동 학습에서 알고리즘은 학습 할 수신 데이터 포인트를 결정합니다 (오라클에서 레이블을 조회합니다). 학습 비용 제약 조건 (조회 예산이 존재하는 경우)의 경우 능동 학습은 일반적으로 여러 온라인 학습 알고리즘보다 성능이 뛰어납니다.
Greedy Coder

55

지도 학습 은 로직에 의사 결정을 내리는 데 도움이되도록 알고리즘에 공급하는 데이터가 "태그"또는 "라벨"된 경우입니다.

예 : 결과를 세분화하기 위해 항목을 스팸으로 플래그 지정해야하는 스팸 필터링을 차단합니다.

비지도 학습 은 원시 데이터 이외의 외부 입력없이 상관 관계를 찾으려고하는 알고리즘 유형입니다.

예 : 데이터 마이닝 클러스터링 알고리즘


33

지도 학습

훈련 데이터가 대응하는 목표 벡터와 함께 입력 벡터의 예를 포함하는 응용은지도 학습 문제로 알려져있다.

비지도 학습

다른 패턴 인식 문제에서, 훈련 데이터는 대응하는 목표 값이없는 입력 벡터 x 세트로 구성된다. 이러한 비지도 학습 문제의 목표는 데이터 내에서 유사한 예제 그룹을 발견하는 것입니다.

패턴 인식 및 기계 학습 (Bishop, 2006)


2
입력 벡터와 목표 벡터 사이를 설명해 주시겠습니까?
rogue lad

20

지도 학습에서는 입력 x에 예상 결과 y(즉, 입력이 모델이 생성 할 것으로 예상되는 출력 x)가 제공되는데,이를 종종 해당 입력의 "클래스"(또는 "라벨")라고합니다 x.

비지도 학습에서는 예제의 "클래스" x가 제공되지 않습니다. 따라서 비지도 학습은 레이블이없는 데이터 세트에서 "숨겨진 구조"를 찾는 것으로 생각할 수 있습니다.

지도 학습에 대한 접근법은 다음과 같습니다.

  • 분류 (1R, Naive Bayes, ID3 CART 등 의사 결정 트리 학습 알고리즘 등)

  • 숫자 값 예측

비지도 학습에 대한 접근법은 다음과 같습니다.

  • 클러스터링 (K- 평균, 계층 적 클러스터링)

  • 협회 규칙 학습


13

예를 들어, 신경망을 훈련시키는 것은 종종지도 학습입니다. 공급하는 지형 벡터에 해당하는 클래스를 네트워크에 알려주는 것입니다.

클러스터링은 비지도 학습입니다. 알고리즘을 통해 샘플을 공통 속성을 공유하는 클래스로 그룹화하는 방법을 결정할 수 있습니다.

비지도 학습의 또 다른 예는 Kohonen의 자체 구성 맵 입니다.


12

나는 당신에게 예를 말할 수 있습니다.

어느 차량이 자동차이고 어떤 것이 오토바이인지 인식해야한다고 가정하십시오.

에서 감독 이 자동차 나 오토바이를 나타내는 경우 학습의 경우, 사용자의 입력 (교육) 데이터 집합의 각 입력 요소에 대해, 당신의 입력 (교육) 표시 할 데이터 세트의 요구는, 당신은 지정해야합니다.

에서 자율 학습의 경우, 당신은 입력 레이블을하지 않습니다. 감독되지 않은 모델은 유사한 기능 / 속성을 기반으로 입력을 클러스터로 클러스터링합니다. 따라서이 경우 "car"와 같은 레이블이 없습니다.


6

지도 학습

지도 학습은 올바른 분류가 이미 지정된 데이터 소스에서 데이터 샘플을 학습하는 것을 기반으로합니다. 이러한 기술은 피드 포워드 또는 MLP (MultiLayer Perceptron) 모델에 사용됩니다. 이 MLP에는 세 가지 특징이 있습니다.

  1. 네트워크가 복잡한 문제를 배우고 해결할 수있게하는 네트워크의 입력 또는 출력 레이어의 일부가 아닌 하나 이상의 숨겨진 뉴런 레이어
  2. 뉴런 활동에 반영된 비선형 성은 구별 할 수 있으며
  3. 네트워크의 상호 연결 모델은 높은 수준의 연결성을 나타냅니다.

훈련을 통한 학습과 함께 이러한 특성은 어렵고 다양한 문제를 해결합니다. 감독 된 ANN 모델에서의 교육을 통한 학습은 오류 역 전파 알고리즘이라고도합니다. 오류 수정 학습 알고리즘은 입력-출력 샘플을 기반으로 네트워크를 학습하고 계산 된 출력과 원하는 출력의 차이 인 오류 신호를 찾고 오류의 곱에 비례하는 뉴런의 시냅스 가중치를 조정합니다. 시냅스 무게의 신호와 입력 인스턴스. 이 원칙을 바탕으로 오류 백 전파 학습은 두 단계로 이루어집니다.

포워드 패스 :

여기서 입력 벡터는 네트워크에 표시됩니다. 이 입력 순방향 신호 전파, 네트워크를 통한 신경 세포에 의한 신경 세포는 출력 신호로서 네트워크의 출력단 출현 에 의해 정의 된 신경 세포의 국소 체 유도 출력 층 O (N)는 계산 된 출력 원하는 반응 과 비교하고 해당 뉴런에 대한 오류 를 찾습니다 . 이 과정에서 네트워크의 시냅스 가중치는 동일하게 유지됩니다.y(n) = φ(v(n))v(n)v(n) =Σ w(n)y(n).d(n)e(n)

뒤로 패스 :

해당 레이어의 출력 뉴런에서 시작된 오류 신호는 네트워크를 통해 뒤로 전파됩니다. 이를 통해 각 레이어의 각 뉴런에 대한 로컬 그래디언트를 계산하고 네트워크의 시냅스 가중치가 델타 규칙에 따라 다음과 같이 변경 될 수 있습니다.

Δw(n) = η * δ(n) * y(n).

이 재귀 계산은 네트워크가 수렴 될 때까지 각 입력 패턴에 대해 정방향 통과와 역방향 통과로 계속됩니다.

ANN의지도 학습 패러다임은 효율적이며 분류, 플랜트 제어, 예측, 예측, 로봇 공학 등과 같은 여러 선형 및 비선형 문제에 대한 솔루션을 찾습니다.

비지도 학습

자가 조직 신경망은 비지도 학습 알고리즘을 사용하여 레이블이없는 입력 데이터에서 숨겨진 패턴을 식별합니다. 이 감독되지 않은 것은 잠재적 인 솔루션을 평가하기 위해 오류 신호를 제공하지 않고 정보를 배우고 구성하는 능력을 말합니다. 비지도 학습에서 학습 알고리즘에 대한 지시가 부족하면 알고리즘이 이전에 고려되지 않은 패턴을 되돌아 볼 수 있기 때문에 언젠가 유리할 수 있습니다. SOM (Self-Organizing Maps)의 주요 특징은 다음과 같습니다.

  1. 임의의 차원의 들어오는 신호 패턴을 1 차원 또는 2 차원 맵으로 변환하고이 변환을 적응 적으로 수행합니다.
  2. 네트워크는 행과 열로 배열 된 뉴런으로 구성된 단일 계산 계층으로 피드 포워드 구조를 나타냅니다. 각 표현 단계에서 각 입력 신호는 적절한 컨텍스트에 유지되며
  3. 밀접하게 관련된 정보를 다루는 뉴런은 서로 가깝고 시냅스 연결을 통해 통신합니다.

계산 계층은 계층의 뉴런이 서로 경쟁하여 활성화되기 때문에 경쟁 계층이라고도합니다. 따라서이 학습 알고리즘을 경쟁 알고리즘이라고합니다. SOM의 비지도 알고리즘은 3 단계로 작동합니다.

경쟁 단계 :

x네트워크에 제시된 각 입력 패턴에 대해 시냅스 무게를 가진 내부 제품 w이 계산되고 경쟁 계층의 뉴런은 뉴런과 유클리드 거리의 입력 벡터에 가까운 시냅스 무게 벡터 간의 경쟁을 유도하는 판별 함수를 찾습니다. 대회에서 우승자로 발표됩니다. 그 뉴런을 가장 잘 맞는 뉴런이라고합니다

i.e. x = arg min ║x - w║.

협력 단계 :

이기는 뉴런 h은 협력 뉴런 의 토폴로지 근방 의 중심을 결정합니다 . 이것은 d협력 뉴런들 간의 측면 상호 작용에 의해 수행된다 . 이 토폴로지 지역은 일정 기간 동안 크기를 줄입니다.

적응 단계 :

이기는 뉴런과 그 주변 뉴런은 적절한 시냅스 무게 조정을 통해 입력 패턴과 관련하여 판별 기능의 개별 값을 증가시킬 수 있습니다.

 Δw = ηh(x)(x –w).

훈련 패턴의 반복 된 제시에서, 시냅스 가중치 벡터는 이웃 업데이트로 인해 입력 패턴의 분포를 따르는 경향이 있으므로 ANN은 감독자없이 학습한다.

자가 조직화 모델은 자연적으로 신경 생물학적 행동을 나타내므로 클러스터링, 음성 인식, 텍스처 분할, 벡터 코딩 등과 같은 많은 실제 응용 분야에서 사용됩니다.

참고.


5

나는 항상 비지도 학습과지도 학습의 구분이 자의적이고 약간 혼란 스럽다는 것을 알았습니다. 두 경우 사이에는 실질적인 차이가 없으며, 알고리즘이 다소 '감시'할 수있는 상황이 있습니다. 반 감독 학습의 존재는 선이 흐리게 보이는 명백한 예입니다.

감독은 어떤 솔루션을 선호해야하는지 알고리즘에 피드백을 제공하는 것으로 생각하는 경향이 있습니다. 스팸 탐지와 같은 기존의 감독 된 설정의 경우 알고리즘에 "훈련 세트에 대해 실수하지 마십시오"라고 말합니다 . 클러스터링과 같은 기존의 감독되지 않은 설정의 경우 알고리즘에 "서로 가까운 지점은 동일한 클러스터에 있어야합니다"라고 말합니다 . 피드백의 첫 번째 형태는 후자의 형태보다 훨씬 더 구체적입니다.

간단히 말해서 누군가가 '감독 된'이라고 말하면 분류를 생각하고, '감독되지 않은'이라고 말할 때 클러스터링을 생각하고 그 이상으로 그것에 대해 너무 걱정하지 마십시오.


2
구별은 실제로 잘 정의되고 단순합니다. David Robles의 답변을 참조하십시오.
bayer

3
그 정의는 괜찮아 보이지만 너무 좁습니다. 반 감독 학습은 무엇입니까? 감독 및 감독되지 않은 상태입니다. 베이지안 추론에서 사전에 컨디셔닝은 어떻습니까? 분명히 그것은 감독의 한 형태입니다. (비 감독 된) 언어 모델과 (일종의 감독 된?) 정렬 된 문장 쌍으로 기계 번역에 사용되는 추론은 어떻습니까? '감독'은 또 다른 형태의 유도 바이어스입니다.
Stompchicken 2009

1
나는 당신의 요점을보고, 매우 흥미있는 것을 발견합니다. 그러나 나는 그렇게 많이 걱정하지 않을 것입니다. 감독되지 않은 감독 / 감독 된 구별은 대부분의 경우에 적용됩니다.
bayer

4

머신 러닝 : 데이터를 통해 학습하고 예측할 수있는 알고리즘의 연구와 구성을 탐구합니다. 이러한 알고리즘은 데이터 기반 예측 또는 의사 결정을 엄격하게 정적 인 것이 아니라 출력으로 표현하기 위해 예제 입력에서 모델을 구축하여 작동합니다. 프로그램 지침.

지도 학습 : 레이블이 지정된 학습 데이터에서 기능을 유추하는 것은 기계 학습 작업이며, 학습 데이터는 일련의 학습 예제로 구성됩니다. 지도 학습에서 각 예제는 입력 객체 (일반적으로 벡터)와 원하는 출력 값 (감독 신호라고도 함)으로 구성된 쌍입니다. 지도 학습 알고리즘은 학습 데이터를 분석하고 추론 함수를 생성하여 새로운 예제를 매핑하는 데 사용할 수 있습니다.

컴퓨터에는 "교사"가 제공하는 예제 입력과 원하는 출력이 제공되며, 목표는 입력을 출력에 매핑하는 일반적인 규칙을 배우는 것입니다. 특히지도 학습 알고리즘은 알려진 입력 데이터 세트와 알려진 응답을 사용합니다. 새로운 데이터에 대한 반응에 대한 합리적인 예측을 생성하도록 모델을 훈련시킵니다.

비지도 학습 : 교사없는 학습입니다. 데이터로 할 수있는 기본적인 일은 데이터를 시각화하는 것입니다. 레이블이없는 데이터에서 숨겨진 구조를 설명하는 기능을 유추하는 것은 기계 학습 작업입니다. 학습자에게 제공된 예제에는 레이블이 없으므로 잠재적 인 솔루션을 평가하기위한 오류 또는 보상 신호가 없습니다. 이것은 비지도 학습과지도 학습을 구별합니다. 비지도 학습은 패턴의 자연스러운 분할을 찾으려고하는 절차를 사용합니다.

비지도 학습의 경우 예측 결과를 바탕으로 한 피드백이 없습니다. 즉, 선생님을 교정 할 필요가 없습니다. 비지도 학습 방법 아래에는 레이블이있는 예제가 제공되지 않으며 학습 과정 동안 결과에 대한 개념이 없습니다. 결과적으로, 패턴을 찾거나 입력 데이터의 그룹을 발견하는 것은 학습 계획 / 모델에 달려 있습니다.

모델을 훈련시키기 위해 많은 양의 데이터가 필요하고 실험하고 탐색 할 의지와 능력은 물론,보다 확립 된 방법으로는 해결되지 않은 과제를 학습해야합니다. 지도 학습보다 더 크고 복잡한 모델을 배울 수 있습니다. 여기 에 좋은 예가 있습니다.

.


4

지도 학습 : 어린이가 유치원에 간다고 말합니다. 여기 선생님은 3 개의 장난감 집, 공 및 차를 보여줍니다. 이제 선생님이 장난감 10 개를 주 십니다. 그는 이전의 경험을 바탕으로 3 상자의 집, 공 및 자동차로 분류합니다. 그래서 몇 세트에 대한 정답을 얻기 위해 교사가 처음으로 아이를 감독했습니다. 그는 알 수없는 장난감을 테스트했습니다. aa

지도되지 않은 학습 : 다시 유치원 예. 어린이에게는 10 개의 장난감이 제공됩니다. 그는 비슷한 것을 세분화하라는 지시를 받았다. 모양, 크기, 색상, 기능 등의 기능을 기반으로 A, B, C라고 말하는 3 개의 그룹을 만들고 그룹화합니다. bb

감독이라는 단어는 답변을 찾기 위해 기계에 감독 / 지침을주고 있음을 의미합니다. 지침을 배우면 새로운 사례를 쉽게 예측할 수 있습니다.

감독되지 않음은 답변 / 라벨을 찾는 방법에 대한 감독이나 지시가 없으며 기계는 인텔리전스를 사용하여 데이터에서 일부 패턴을 찾습니다. 여기서는 예측하지 않고 비슷한 데이터를 가진 클러스터를 찾으려고 시도합니다.


4

차이점을 자세히 설명하는 많은 답변이 이미 있습니다. codeacademy 에서이 GIF를 찾았습니다 했으며 종종 차이점을 효과적으로 설명하는 데 도움이됩니다.

지도 학습

여기에 이미지 설명을 입력하십시오 훈련 이미지에는 여기에 레이블이 있으며 모델은 이미지의 이름을 배우고 있습니다.

비지도 학습

여기에 이미지 설명을 입력하십시오 여기서 수행되는 작업은 그룹화 (클러스터링)이며 모델은 이미지에 대해 아무것도 모릅니다.


4

신경망의 학습 알고리즘은 감독되거나 감독되지 않을 수 있습니다.

원하는 출력이 이미 알려진 경우 신경망은 감독 학습을 말한다. 예 : 패턴 연관

비지도를 배우는 신경망에는 그러한 목표 출력이 없습니다. 학습 과정의 결과가 어떤 것인지 판단 할 수 없습니다. 학습 과정 동안, 이러한 신경망의 단위 (무게 값)는 주어진 입력 값에 따라 특정 범위 내에서 "배열"됩니다. 목표는 값 범위의 특정 영역에서 유사한 단위를 서로 그룹화하는 것입니다. 예 : 패턴 분류


3

답변이 주어진 데이터를 고려한지도 학습.

스팸 / 스팸 아님으로 레이블이 지정된 이메일이 있으면 스팸 필터를 배우십시오.

당뇨병이있는 것으로 진단 된 환자의 데이터 세트가 주어지면, 새로운 환자를 당뇨병이있는 것으로 분류하는 것을 배우십시오.

무응답 학습은 답이없는 데이터를 고려하여 PC가 사물을 그룹화하도록합니다.

웹에서 찾은 일련의 뉴스 기사가 있으면 동일한 기사에 대한 기사 세트로 그룹화하십시오.

맞춤 데이터 데이터베이스가 제공되면 시장 세그먼트를 자동으로 검색하고 고객을 여러 시장 세그먼트로 그룹화합니다.

참고


3

지도 학습

여기에서, 네트워크를 훈련시키는 데 사용되는 모든 입력 패턴은 목표 또는 원하는 패턴 인 출력 패턴과 관련됩니다. 오류를 결정하기 위해 네트워크의 계산 된 출력과 올바른 예상 출력을 비교할 때 학습 프로세스 중에 교사가 있다고 가정합니다. 그런 다음 오류를 사용하여 네트워크 매개 변수를 변경하여 성능을 향상시킬 수 있습니다.

비지도 학습

이 학습 방법에서는 목표 출력이 네트워크에 표시되지 않습니다. 원하는 패턴을 제시 할 교사가없는 것처럼 시스템은 입력 패턴의 구조적 특징을 발견하고 적용하여 자체적으로 학습합니다.


3

지도 학습 : 정답과 함께 다양한 레이블이 지정된 예제 데이터를 입력으로 제공합니다. 이 알고리즘은 그로부터 배우고 그 이후의 입력을 기반으로 올바른 결과를 예측하기 시작합니다. : 이메일 스팸 필터

비지도 학습 : 당신은 단지 데이터를 제공하고 레이블이나 정답과 같은 것을 말하지 않습니다. 알고리즘은 데이터의 패턴을 자동으로 분석합니다. : Google 뉴스


3

간단하게 유지하도록 노력하겠습니다.

지도 학습 : 이 학습 기술에서는 데이터 세트가 제공되며 시스템은 데이터 세트의 올바른 출력을 이미 알고 있습니다. 여기에서 우리 시스템은 자신의 가치를 예측함으로써 배웁니다. 그런 다음 비용 함수를 사용하여 예측이 실제 출력과 얼마나 가까운 지 확인하여 정확도를 확인합니다.

비지도 학습 : 이 방법에서는 결과에 대한 지식이 거의 또는 전혀 없습니다. 대신 변수의 영향을 모르는 데이터에서 구조를 도출합니다. 데이터의 변수 간 관계에 따라 데이터를 클러스터링하여 구조를 만듭니다. 여기에는 예측에 기반한 피드백이 없습니다.


2

지도 학습

입력 x와 목표 출력 t가 있습니다. 따라서 누락 된 부분을 일반화하도록 알고리즘을 학습시킵니다. 목표가 주어지기 때문에 감독됩니다. 알고리즘을 알려주는 관리자는 다음과 같습니다. 예제 x의 경우 t를 출력해야합니다!

비지도 학습

분할, 클러스터링 및 압축은 일반적 으로이 방향으로 계산되지만 좋은 정의를 내기가 쉽지 않습니다.

압축 을 위해 자동 인코더를 예로 들어 봅시다 . 입력 x 만 주어졌지만, 목표는 x라고 알고리즘에 알려주는 것은 인간 엔지니어입니다. 어떤면에서 이것은지도 학습과 다르지 않습니다.

클러스터링 및 세분화의 경우 머신 러닝의 정의에 실제로 맞는지 확실하지 않습니다 ( 다른 질문 참조 ).


2

지도 학습 : 데이터에 레이블을 지정했으며 그로부터 학습해야합니다. 예 : 가격과 함께 주택 데이터를 계산 한 후 가격 예측 방법 배우기

비지도 학습 : 트렌드를 찾아서 사전 레이블을 지정하지 않고 예측해야합니다. 예를 들어, 수업 시간에 다른 사람들과 새로운 사람이 와서이 새로운 학생이 속한 그룹이됩니다.


1

에서 감독 학습 우리는 입력 및 출력이 있어야 할 것을 알고있다. 예를 들어, 자동차 세트가 주어집니다. 우리는 어느 것이 빨간색이고 어떤 것이 파란색인지 알아 내야합니다.

반면, 비지도 학습 은 결과가 어떻게 이루어져야하는지 전혀 또는 전혀 모르게 답을 찾아야하는 곳입니다. 예를 들어, 학습자는 얼굴 패턴과 "당신은 무엇에 대해 웃고 있습니까?"와 같은 단어의 상관 관계에 따라 사람들이 웃고있을 때를 감지하는 모델을 만들 수 있습니다.


1

지도 학습은 훈련 중 학습을 기반으로 훈련 된 레이블 중 하나에 새 항목에 레이블을 지정할 수 있습니다. 많은 수의 교육 데이터 세트, 검증 데이터 세트 및 테스트 데이터 세트를 제공해야합니다. 레이블이있는 학습 데이터와 함께 숫자의 픽셀 이미지 벡터를 제공하면 숫자를 식별 할 수 있습니다.

비지도 학습에는 훈련 데이터 세트가 필요하지 않습니다. 비지도 학습에서는 입력 벡터의 차이에 따라 항목을 다른 클러스터로 그룹화 할 수 있습니다. 숫자의 픽셀 이미지 벡터를 제공하고 10 개의 범주로 분류하도록 요청하면 그렇게 할 수 있습니다. 그러나 교육 레이블을 제공하지 않았으므로 레이블을 지정하는 방법을 알고 있습니다.


1

지도 학습은 기본적으로 입력 변수 (x) 및 출력 변수 (y)가 있고 알고리즘을 사용하여 입력에서 출력으로 매핑 기능을 학습합니다. 우리가 이것을 감독 대상이라고 부르는 이유는 알고리즘이 훈련 데이터 세트에서 학습하기 때문에 알고리즘은 훈련 데이터에 대해 반복적으로 예측을하기 때문입니다. 감독에는 분류와 회귀의 두 가지 유형이 있습니다. 분류는 출력 변수가 yes / no, true / false와 같은 범주 인 경우입니다. 회귀는 출력이 사람의 신장, 온도 등과 같은 실제 값일 때입니다.

UN지도 학습은 입력 데이터 (X) 만 있고 출력 변수는없는 곳입니다. 위의지도 학습과는 달리 정답이없고 교사가 없기 때문에이를 비지도 학습이라고합니다. 알고리즘은 데이터에서 흥미로운 구조를 발견하고 제시하기위한 자체 고안에 맡겨져 있습니다.

비지도 학습의 유형은 군집 및 협회입니다.


1

지도 학습은 기본적으로 기계가 학습하는 훈련 데이터에 이미 레이블이 지정된 기술입니다. 이는 훈련 중에 데이터를 이미 분류 한 단순한 짝수 홀수 분류기를 가정합니다. 따라서 "LABELLED"데이터를 사용합니다.

반대로 감독되지 않은 학습은 기계 자체가 데이터에 라벨을 붙이는 기술입니다. 또는 기계가 처음부터 스스로 배우는 경우를 말할 수 있습니다.


1

Simple Supervised learning 에서 우리는 몇 가지 레이블이있는 기계 학습 문제의 유형이며 해당 레이블을 사용하여 회귀 및 분류와 같은 알고리즘을 구현합니다. 분류는 출력이 0 또는 1, true / false, 예 아니오. 가격 집과 같은 실제 가치를 내면 회귀가 적용됩니다

비지도 학습 은 레이블이없는 기계 학습 문제의 한 유형으로, 일부 데이터 만 있고 구조화되지 않은 데이터가 있으며 다양한 비지도 알고리즘을 사용하여 데이터 (데이터 그룹화)를 클러스터링해야 함을 의미합니다.


1

감독 된 머신 러닝

"훈련 데이터 세트에서 학습하고 결과를 예측하는 알고리즘의 프로세스."

훈련 데이터에 직접 비례 한 예측 결과의 정확도 (길이)

지도 학습은 입력 변수 (x) (트레이닝 데이터 세트)와 출력 변수 (Y) (테스트 데이터 세트)가 있고 알고리즘을 사용하여 입력에서 출력으로의 맵핑 기능을 학습합니다.

Y = f(X)

주요 유형 :

  • 분류 (개별 y 축)
  • 예측 적 (연속 y 축)

알고리즘 :

  • 분류 알고리즘 :

    Neural Networks  
    Naïve Bayes classifiers  
    Fisher linear discriminant  
    KNN 
    Decision Tree 
    Super Vector Machines
    
  • 예측 알고리즘 :

    Nearest  neighbor  
    Linear Regression,Multi Regression 
    

응용 분야 :

  1. 이메일을 스팸으로 분류
  2. 환자의 질병 유무 분류
  3. 음성 인식

  4. HR 선택 특정 후보를 예측

  5. 주식 시장 가격 예측


1

지도 학습 :

지도 학습 알고리즘은 학습 데이터를 분석하고 추론 함수를 생성하여 새로운 예제를 매핑하는 데 사용할 수 있습니다.

  1. 우리는 훈련 데이터를 제공하고 특정 입력에 대한 올바른 결과를 알고 있습니다
  2. 입력과 출력의 관계를 안다

문제의 범주 :

회귀 : 연속 출력 내 결과 예측 => 입력 변수를 일부 연속 함수에 매핑합니다.

예:

사람의 사진이 주어지면 나이를 예측하십시오.

분류 : 결과를 예측하여 이산 출력 => 입력 변수를 이산 범주로 매핑

예:

이 튜 머는 암성입니까?

지도 학습

비지도 학습 :

비지도 학습은 분류, 분류 또는 분류되지 않은 테스트 데이터를 통해 학습합니다. 비지도 학습은 데이터의 공통성을 식별하고 각각의 새 데이터 조각에서 이러한 공통성의 존재 여부에 따라 반응합니다.

  1. 데이터의 변수 간 관계를 기반으로 데이터를 클러스터링하여이 구조를 도출 할 수 있습니다.

  2. 예측 결과에 따른 피드백이 없습니다.

문제의 범주 :

클러스터링 : 동일한 그룹 (클러스터라고 함)의 개체가 다른 그룹 (클러스터)의 개체와 더 유사하게 (클러스터라고 함) 개체 집합을 그룹화하는 작업입니다.

예:

1,000,000 개의 서로 다른 유전자를 모아서 수명, 위치, 역할 등과 같은 다른 변수에 의해 유사하거나 관련이있는 그룹으로 이들 유전자를 자동으로 그룹화하는 방법을 찾으십시오 .

비지도 학습

인기있는 사용 사례는 다음과 같습니다.

데이터 마이닝에서 분류와 클러스터링의 차이점은 무엇입니까?

참고 문헌 :

감독 _ 학습

비지도 학습

코스 라에서 기계 학습

데이터 과학


1

지도 학습

여기에 이미지 설명을 입력하십시오

비지도 학습

여기에 이미지 설명을 입력하십시오

예:

지도 학습 :

  • 사과 한 봉지
  • 오렌지 한 봉지

    => 빌드 모델

  • 사과와 오렌지의 혼합 가방.

    => 분류하십시오

비지도 학습 :

  • 사과와 오렌지의 혼합 가방.

    => 빌드 모델

  • 다른 혼합 가방

    => 분류하십시오


1

간단히 말해서 .. :) 그것은 내 이해이며, 자유롭게 수정하십시오. 지도 학습 은 제공된 데이터를 기반으로 예측하는 것을 알고 있습니다. 따라서 데이터 세트에 술어가 필요한 열이 있습니다. 비지도 학습 은 제공된 데이터 세트에서 의미를 추출하려고합니다. 우리는 무엇을 예측해야하는지 명확하지 않습니다. 질문은 우리가 왜 이런 일을 하는가? 따라서 새로운 데이터를 수신하면 해당 데이터를 식별 된 클러스터 / 그룹과 연결하고 해당 기능을 이해합니다.

도움이 되길 바랍니다.


1

지도 학습

지도 학습은 원시 입력의 출력을 알 수있는 곳입니다. 즉, 머신 학습 모델을 훈련하는 동안 제공 결과에서 감지해야 할 내용을 이해하고 훈련하는 동안 시스템을 안내 할 수 있도록 데이터에 레이블이 지정됩니다. 사전 레이블이 지정된 객체를 기반으로 감지하여 교육에서 제공 한 유사한 객체를 감지합니다.

여기서 알고리즘은 데이터의 구조와 패턴이 무엇인지 알게됩니다. 지도 학습은 분류에 사용됩니다

예를 들어, 모양이 정사각형, 원, 삼각형 인 다른 객체를 가질 수 있습니다. 우리의 임무는 레이블이 지정된 데이터 집합에 모든 레이블이 지정된 동일한 유형의 모양을 정렬하는 것입니다. 훈련 날짜를 기준으로 도형 감지를 시작합니다.

비지도 학습

비지도 학습은 최종 결과를 알 수없는 안내되지 않은 학습으로, 데이터 세트를 클러스터링하고 객체의 유사한 속성을 기반으로 객체를 여러 묶음으로 나누고 객체를 감지합니다.

여기서 알고리즘은 원시 데이터에서 다른 패턴을 검색하고이를 기반으로 데이터를 클러스터링합니다. 비지도 학습은 클러스터링에 사용됩니다.

예를 들어, 여러 모양의 사각형, 원, 삼각형의 서로 다른 객체를 가질 수 있으므로 객체 속성을 기반으로 묶음을 만듭니다 .4면이 있으면 사각형으로 간주하고 3면이 삼각형이면 원 이외의면이 없으면 여기에 데이터에 레이블이 지정되지 않고 다양한 모양을 감지하는 방법을 배우게됩니다.


1

기계 학습은 인간 행동을 모방하기 위해 기계를 만들려고하는 분야입니다.

아기처럼 기계를 훈련시키는 방법 인간이 다양한 특징을 가진 데이터를 공급함으로써 기계를 훈련하는 것과 같은 방식으로 인간이 배우고, 특징을 식별하고, 패턴을 인식하고, 스스로 훈련하는 방식. 머신 알고리즘은 데이터 내에서 패턴을 식별하여 특정 카테고리로 분류합니다.

기계 학습은 크게지도 및 비지도 학습의 두 가지 범주로 나뉩니다.

지도 학습은 해당 목표 값 (출력)이있는 입력 벡터 / 데이터가있는 개념이며,지도 학습은 해당 목표 값이없는 입력 벡터 / 데이터 만있는 개념입니다.

지도 학습의 예는 해당 숫자가 [0-9] 인 숫자 이미지가있는 자필 숫자 인식이며,지도 학습이 아닌 예는 구매 행동으로 고객을 그룹화하는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.