답변:
이 기본적인 질문을하므로 Machine Learning 자체를 지정하는 것이 좋습니다.
머신 러닝은 데이터 중심의 알고리즘 클래스입니다. 즉 "일반"알고리즘과 달리 "좋은 답변"이 무엇인지 "알려주는"데이터입니다. 예 : 이미지에서 얼굴 감지를위한 가상의 비 기계 학습 알고리즘은 얼굴이 무엇인지 (피부와 같은 디스크, 눈이 예상되는 어두운 영역)를 정의하려고 시도합니다. 머신 러닝 알고리즘은 그러한 코드화 된 정의를 갖지 않지만 "예제로 학습"할 것입니다 : 얼굴과 얼굴이 아닌 여러 이미지를 보여 주면 좋은 알고리즘이 결국에는 보이지 않는지를 배우고 예측할 수 있습니다 이미지는 얼굴입니다.
이 특정 얼굴 감지 예는 감독됩니다 . 즉, 예에 레이블을 지정 해야 하거나 어떤 얼굴이 아닌 얼굴을 명시 적으로 말해야합니다.
에서 자율 당신의 예제가되지 않는 알고리즘 표시 , 당신은 아무 말도하지 않습니다 즉. 물론 이러한 경우 알고리즘 자체는 얼굴을 "발명"할 수 없지만 데이터를 다른 그룹으로 클러스터링 하려고 시도 할 수 있습니다 . 예를 들어 얼굴이 말과는 매우 다른 풍경과 매우 다르다는 것을 구별 할 수 있습니다.
또 다른 답변이 그것을 언급하고 있기 때문에 (잘못된 방식으로) : "중급"형태의 감독, 즉 반 감독 적이고 적극적인 학습이 있습니다. 엄밀히 말하면이 방법은 많은 수의 레이블이 지정된 예제를 피하는 "스마트 한"방법이있는 감독 방법입니다. 적극적인 학습에서 알고리즘 자체는 레이블을 지정할 항목을 결정합니다 (예 : 풍경과 말에 대해 확신 할 수 있지만 고릴라가 실제로 얼굴 그림인지 확인하도록 요청할 수 있음). semi-supervised learning에는 레이블이있는 예제로 시작하여 레이블이없는 많은 데이터에 대해 생각하는 방식을 서로 "알려주는"두 가지 알고리즘이 있습니다. 이 "토론"에서 그들은 배운다.
지도 학습에서는 입력 x
에 예상 결과 y
(즉, 입력이 모델이 생성 할 것으로 예상되는 출력 x
)가 제공되는데,이를 종종 해당 입력의 "클래스"(또는 "라벨")라고합니다 x
.
비지도 학습에서는 예제의 "클래스" x
가 제공되지 않습니다. 따라서 비지도 학습은 레이블이없는 데이터 세트에서 "숨겨진 구조"를 찾는 것으로 생각할 수 있습니다.
지도 학습에 대한 접근법은 다음과 같습니다.
분류 (1R, Naive Bayes, ID3 CART 등 의사 결정 트리 학습 알고리즘 등)
숫자 값 예측
비지도 학습에 대한 접근법은 다음과 같습니다.
클러스터링 (K- 평균, 계층 적 클러스터링)
협회 규칙 학습
예를 들어, 신경망을 훈련시키는 것은 종종지도 학습입니다. 공급하는 지형 벡터에 해당하는 클래스를 네트워크에 알려주는 것입니다.
클러스터링은 비지도 학습입니다. 알고리즘을 통해 샘플을 공통 속성을 공유하는 클래스로 그룹화하는 방법을 결정할 수 있습니다.
비지도 학습의 또 다른 예는 Kohonen의 자체 구성 맵 입니다.
나는 당신에게 예를 말할 수 있습니다.
어느 차량이 자동차이고 어떤 것이 오토바이인지 인식해야한다고 가정하십시오.
에서 감독 이 자동차 나 오토바이를 나타내는 경우 학습의 경우, 사용자의 입력 (교육) 데이터 집합의 각 입력 요소에 대해, 당신의 입력 (교육) 표시 할 데이터 세트의 요구는, 당신은 지정해야합니다.
에서 자율 학습의 경우, 당신은 입력 레이블을하지 않습니다. 감독되지 않은 모델은 유사한 기능 / 속성을 기반으로 입력을 클러스터로 클러스터링합니다. 따라서이 경우 "car"와 같은 레이블이 없습니다.
지도 학습
지도 학습은 올바른 분류가 이미 지정된 데이터 소스에서 데이터 샘플을 학습하는 것을 기반으로합니다. 이러한 기술은 피드 포워드 또는 MLP (MultiLayer Perceptron) 모델에 사용됩니다. 이 MLP에는 세 가지 특징이 있습니다.
훈련을 통한 학습과 함께 이러한 특성은 어렵고 다양한 문제를 해결합니다. 감독 된 ANN 모델에서의 교육을 통한 학습은 오류 역 전파 알고리즘이라고도합니다. 오류 수정 학습 알고리즘은 입력-출력 샘플을 기반으로 네트워크를 학습하고 계산 된 출력과 원하는 출력의 차이 인 오류 신호를 찾고 오류의 곱에 비례하는 뉴런의 시냅스 가중치를 조정합니다. 시냅스 무게의 신호와 입력 인스턴스. 이 원칙을 바탕으로 오류 백 전파 학습은 두 단계로 이루어집니다.
포워드 패스 :
여기서 입력 벡터는 네트워크에 표시됩니다. 이 입력 순방향 신호 전파, 네트워크를 통한 신경 세포에 의한 신경 세포는 출력 신호로서 네트워크의 출력단 출현 에 의해 정의 된 신경 세포의 국소 체 유도 출력 층 O (N)는 계산 된 출력 원하는 반응 과 비교하고 해당 뉴런에 대한 오류 를 찾습니다 . 이 과정에서 네트워크의 시냅스 가중치는 동일하게 유지됩니다.y(n) = φ(v(n))
v(n)
v(n) =Σ w(n)y(n).
d(n)
e(n)
뒤로 패스 :
해당 레이어의 출력 뉴런에서 시작된 오류 신호는 네트워크를 통해 뒤로 전파됩니다. 이를 통해 각 레이어의 각 뉴런에 대한 로컬 그래디언트를 계산하고 네트워크의 시냅스 가중치가 델타 규칙에 따라 다음과 같이 변경 될 수 있습니다.
Δw(n) = η * δ(n) * y(n).
이 재귀 계산은 네트워크가 수렴 될 때까지 각 입력 패턴에 대해 정방향 통과와 역방향 통과로 계속됩니다.
ANN의지도 학습 패러다임은 효율적이며 분류, 플랜트 제어, 예측, 예측, 로봇 공학 등과 같은 여러 선형 및 비선형 문제에 대한 솔루션을 찾습니다.
비지도 학습
자가 조직 신경망은 비지도 학습 알고리즘을 사용하여 레이블이없는 입력 데이터에서 숨겨진 패턴을 식별합니다. 이 감독되지 않은 것은 잠재적 인 솔루션을 평가하기 위해 오류 신호를 제공하지 않고 정보를 배우고 구성하는 능력을 말합니다. 비지도 학습에서 학습 알고리즘에 대한 지시가 부족하면 알고리즘이 이전에 고려되지 않은 패턴을 되돌아 볼 수 있기 때문에 언젠가 유리할 수 있습니다. SOM (Self-Organizing Maps)의 주요 특징은 다음과 같습니다.
계산 계층은 계층의 뉴런이 서로 경쟁하여 활성화되기 때문에 경쟁 계층이라고도합니다. 따라서이 학습 알고리즘을 경쟁 알고리즘이라고합니다. SOM의 비지도 알고리즘은 3 단계로 작동합니다.
경쟁 단계 :
x
네트워크에 제시된 각 입력 패턴에 대해 시냅스 무게를 가진 내부 제품 w
이 계산되고 경쟁 계층의 뉴런은 뉴런과 유클리드 거리의 입력 벡터에 가까운 시냅스 무게 벡터 간의 경쟁을 유도하는 판별 함수를 찾습니다. 대회에서 우승자로 발표됩니다. 그 뉴런을 가장 잘 맞는 뉴런이라고합니다
i.e. x = arg min ║x - w║.
협력 단계 :
이기는 뉴런 h
은 협력 뉴런 의 토폴로지 근방 의 중심을 결정합니다 . 이것은 d
협력 뉴런들 간의 측면 상호 작용에 의해 수행된다 . 이 토폴로지 지역은 일정 기간 동안 크기를 줄입니다.
적응 단계 :
이기는 뉴런과 그 주변 뉴런은 적절한 시냅스 무게 조정을 통해 입력 패턴과 관련하여 판별 기능의 개별 값을 증가시킬 수 있습니다.
Δw = ηh(x)(x –w).
훈련 패턴의 반복 된 제시에서, 시냅스 가중치 벡터는 이웃 업데이트로 인해 입력 패턴의 분포를 따르는 경향이 있으므로 ANN은 감독자없이 학습한다.
자가 조직화 모델은 자연적으로 신경 생물학적 행동을 나타내므로 클러스터링, 음성 인식, 텍스처 분할, 벡터 코딩 등과 같은 많은 실제 응용 분야에서 사용됩니다.
나는 항상 비지도 학습과지도 학습의 구분이 자의적이고 약간 혼란 스럽다는 것을 알았습니다. 두 경우 사이에는 실질적인 차이가 없으며, 알고리즘이 다소 '감시'할 수있는 상황이 있습니다. 반 감독 학습의 존재는 선이 흐리게 보이는 명백한 예입니다.
감독은 어떤 솔루션을 선호해야하는지 알고리즘에 피드백을 제공하는 것으로 생각하는 경향이 있습니다. 스팸 탐지와 같은 기존의 감독 된 설정의 경우 알고리즘에 "훈련 세트에 대해 실수하지 마십시오"라고 말합니다 . 클러스터링과 같은 기존의 감독되지 않은 설정의 경우 알고리즘에 "서로 가까운 지점은 동일한 클러스터에 있어야합니다"라고 말합니다 . 피드백의 첫 번째 형태는 후자의 형태보다 훨씬 더 구체적입니다.
간단히 말해서 누군가가 '감독 된'이라고 말하면 분류를 생각하고, '감독되지 않은'이라고 말할 때 클러스터링을 생각하고 그 이상으로 그것에 대해 너무 걱정하지 마십시오.
머신 러닝 : 데이터를 통해 학습하고 예측할 수있는 알고리즘의 연구와 구성을 탐구합니다. 이러한 알고리즘은 데이터 기반 예측 또는 의사 결정을 엄격하게 정적 인 것이 아니라 출력으로 표현하기 위해 예제 입력에서 모델을 구축하여 작동합니다. 프로그램 지침.
지도 학습 : 레이블이 지정된 학습 데이터에서 기능을 유추하는 것은 기계 학습 작업이며, 학습 데이터는 일련의 학습 예제로 구성됩니다. 지도 학습에서 각 예제는 입력 객체 (일반적으로 벡터)와 원하는 출력 값 (감독 신호라고도 함)으로 구성된 쌍입니다. 지도 학습 알고리즘은 학습 데이터를 분석하고 추론 함수를 생성하여 새로운 예제를 매핑하는 데 사용할 수 있습니다.
컴퓨터에는 "교사"가 제공하는 예제 입력과 원하는 출력이 제공되며, 목표는 입력을 출력에 매핑하는 일반적인 규칙을 배우는 것입니다. 특히지도 학습 알고리즘은 알려진 입력 데이터 세트와 알려진 응답을 사용합니다. 새로운 데이터에 대한 반응에 대한 합리적인 예측을 생성하도록 모델을 훈련시킵니다.
비지도 학습 : 교사없는 학습입니다. 데이터로 할 수있는 기본적인 일은 데이터를 시각화하는 것입니다. 레이블이없는 데이터에서 숨겨진 구조를 설명하는 기능을 유추하는 것은 기계 학습 작업입니다. 학습자에게 제공된 예제에는 레이블이 없으므로 잠재적 인 솔루션을 평가하기위한 오류 또는 보상 신호가 없습니다. 이것은 비지도 학습과지도 학습을 구별합니다. 비지도 학습은 패턴의 자연스러운 분할을 찾으려고하는 절차를 사용합니다.
비지도 학습의 경우 예측 결과를 바탕으로 한 피드백이 없습니다. 즉, 선생님을 교정 할 필요가 없습니다. 비지도 학습 방법 아래에는 레이블이있는 예제가 제공되지 않으며 학습 과정 동안 결과에 대한 개념이 없습니다. 결과적으로, 패턴을 찾거나 입력 데이터의 그룹을 발견하는 것은 학습 계획 / 모델에 달려 있습니다.
모델을 훈련시키기 위해 많은 양의 데이터가 필요하고 실험하고 탐색 할 의지와 능력은 물론,보다 확립 된 방법으로는 해결되지 않은 과제를 학습해야합니다. 지도 학습보다 더 크고 복잡한 모델을 배울 수 있습니다. 여기 에 좋은 예가 있습니다.
.
지도 학습 : 어린이가 유치원에 간다고 말합니다. 여기 선생님은 3 개의 장난감 집, 공 및 차를 보여줍니다. 이제 선생님이 장난감 10 개를 주 십니다. 그는 이전의 경험을 바탕으로 3 상자의 집, 공 및 자동차로 분류합니다. 그래서 몇 세트에 대한 정답을 얻기 위해 교사가 처음으로 아이를 감독했습니다. 그는 알 수없는 장난감을 테스트했습니다.
지도되지 않은 학습 : 다시 유치원 예. 어린이에게는 10 개의 장난감이 제공됩니다. 그는 비슷한 것을 세분화하라는 지시를 받았다. 모양, 크기, 색상, 기능 등의 기능을 기반으로 A, B, C라고 말하는 3 개의 그룹을 만들고 그룹화합니다.
감독이라는 단어는 답변을 찾기 위해 기계에 감독 / 지침을주고 있음을 의미합니다. 지침을 배우면 새로운 사례를 쉽게 예측할 수 있습니다.
감독되지 않음은 답변 / 라벨을 찾는 방법에 대한 감독이나 지시가 없으며 기계는 인텔리전스를 사용하여 데이터에서 일부 패턴을 찾습니다. 여기서는 예측하지 않고 비슷한 데이터를 가진 클러스터를 찾으려고 시도합니다.
차이점을 자세히 설명하는 많은 답변이 이미 있습니다. codeacademy 에서이 GIF를 찾았습니다 했으며 종종 차이점을 효과적으로 설명하는 데 도움이됩니다.
훈련 이미지에는 여기에 레이블이 있으며 모델은 이미지의 이름을 배우고 있습니다.
답변이 주어진 데이터를 고려한지도 학습.
스팸 / 스팸 아님으로 레이블이 지정된 이메일이 있으면 스팸 필터를 배우십시오.
당뇨병이있는 것으로 진단 된 환자의 데이터 세트가 주어지면, 새로운 환자를 당뇨병이있는 것으로 분류하는 것을 배우십시오.
무응답 학습은 답이없는 데이터를 고려하여 PC가 사물을 그룹화하도록합니다.
웹에서 찾은 일련의 뉴스 기사가 있으면 동일한 기사에 대한 기사 세트로 그룹화하십시오.
맞춤 데이터 데이터베이스가 제공되면 시장 세그먼트를 자동으로 검색하고 고객을 여러 시장 세그먼트로 그룹화합니다.
지도 학습
여기에서, 네트워크를 훈련시키는 데 사용되는 모든 입력 패턴은 목표 또는 원하는 패턴 인 출력 패턴과 관련됩니다. 오류를 결정하기 위해 네트워크의 계산 된 출력과 올바른 예상 출력을 비교할 때 학습 프로세스 중에 교사가 있다고 가정합니다. 그런 다음 오류를 사용하여 네트워크 매개 변수를 변경하여 성능을 향상시킬 수 있습니다.
비지도 학습
이 학습 방법에서는 목표 출력이 네트워크에 표시되지 않습니다. 원하는 패턴을 제시 할 교사가없는 것처럼 시스템은 입력 패턴의 구조적 특징을 발견하고 적용하여 자체적으로 학습합니다.
간단하게 유지하도록 노력하겠습니다.
지도 학습 : 이 학습 기술에서는 데이터 세트가 제공되며 시스템은 데이터 세트의 올바른 출력을 이미 알고 있습니다. 여기에서 우리 시스템은 자신의 가치를 예측함으로써 배웁니다. 그런 다음 비용 함수를 사용하여 예측이 실제 출력과 얼마나 가까운 지 확인하여 정확도를 확인합니다.
비지도 학습 : 이 방법에서는 결과에 대한 지식이 거의 또는 전혀 없습니다. 대신 변수의 영향을 모르는 데이터에서 구조를 도출합니다. 데이터의 변수 간 관계에 따라 데이터를 클러스터링하여 구조를 만듭니다. 여기에는 예측에 기반한 피드백이 없습니다.
입력 x와 목표 출력 t가 있습니다. 따라서 누락 된 부분을 일반화하도록 알고리즘을 학습시킵니다. 목표가 주어지기 때문에 감독됩니다. 알고리즘을 알려주는 관리자는 다음과 같습니다. 예제 x의 경우 t를 출력해야합니다!
분할, 클러스터링 및 압축은 일반적 으로이 방향으로 계산되지만 좋은 정의를 내기가 쉽지 않습니다.
압축 을 위해 자동 인코더를 예로 들어 봅시다 . 입력 x 만 주어졌지만, 목표는 x라고 알고리즘에 알려주는 것은 인간 엔지니어입니다. 어떤면에서 이것은지도 학습과 다르지 않습니다.
클러스터링 및 세분화의 경우 머신 러닝의 정의에 실제로 맞는지 확실하지 않습니다 ( 다른 질문 참조 ).
지도 학습은 훈련 중 학습을 기반으로 훈련 된 레이블 중 하나에 새 항목에 레이블을 지정할 수 있습니다. 많은 수의 교육 데이터 세트, 검증 데이터 세트 및 테스트 데이터 세트를 제공해야합니다. 레이블이있는 학습 데이터와 함께 숫자의 픽셀 이미지 벡터를 제공하면 숫자를 식별 할 수 있습니다.
비지도 학습에는 훈련 데이터 세트가 필요하지 않습니다. 비지도 학습에서는 입력 벡터의 차이에 따라 항목을 다른 클러스터로 그룹화 할 수 있습니다. 숫자의 픽셀 이미지 벡터를 제공하고 10 개의 범주로 분류하도록 요청하면 그렇게 할 수 있습니다. 그러나 교육 레이블을 제공하지 않았으므로 레이블을 지정하는 방법을 알고 있습니다.
지도 학습은 기본적으로 입력 변수 (x) 및 출력 변수 (y)가 있고 알고리즘을 사용하여 입력에서 출력으로 매핑 기능을 학습합니다. 우리가 이것을 감독 대상이라고 부르는 이유는 알고리즘이 훈련 데이터 세트에서 학습하기 때문에 알고리즘은 훈련 데이터에 대해 반복적으로 예측을하기 때문입니다. 감독에는 분류와 회귀의 두 가지 유형이 있습니다. 분류는 출력 변수가 yes / no, true / false와 같은 범주 인 경우입니다. 회귀는 출력이 사람의 신장, 온도 등과 같은 실제 값일 때입니다.
UN지도 학습은 입력 데이터 (X) 만 있고 출력 변수는없는 곳입니다. 위의지도 학습과는 달리 정답이없고 교사가 없기 때문에이를 비지도 학습이라고합니다. 알고리즘은 데이터에서 흥미로운 구조를 발견하고 제시하기위한 자체 고안에 맡겨져 있습니다.
비지도 학습의 유형은 군집 및 협회입니다.
Simple Supervised learning 에서 우리는 몇 가지 레이블이있는 기계 학습 문제의 유형이며 해당 레이블을 사용하여 회귀 및 분류와 같은 알고리즘을 구현합니다. 분류는 출력이 0 또는 1, true / false, 예 아니오. 가격 집과 같은 실제 가치를 내면 회귀가 적용됩니다
비지도 학습 은 레이블이없는 기계 학습 문제의 한 유형으로, 일부 데이터 만 있고 구조화되지 않은 데이터가 있으며 다양한 비지도 알고리즘을 사용하여 데이터 (데이터 그룹화)를 클러스터링해야 함을 의미합니다.
감독 된 머신 러닝
"훈련 데이터 세트에서 학습하고 결과를 예측하는 알고리즘의 프로세스."
훈련 데이터에 직접 비례 한 예측 결과의 정확도 (길이)
지도 학습은 입력 변수 (x) (트레이닝 데이터 세트)와 출력 변수 (Y) (테스트 데이터 세트)가 있고 알고리즘을 사용하여 입력에서 출력으로의 맵핑 기능을 학습합니다.
Y = f(X)
주요 유형 :
알고리즘 :
분류 알고리즘 :
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
예측 알고리즘 :
Nearest neighbor
Linear Regression,Multi Regression
응용 분야 :
음성 인식
HR 선택 특정 후보를 예측
주식 시장 가격 예측
지도 학습 :
지도 학습 알고리즘은 학습 데이터를 분석하고 추론 함수를 생성하여 새로운 예제를 매핑하는 데 사용할 수 있습니다.
문제의 범주 :
회귀 : 연속 출력 내 결과 예측 => 입력 변수를 일부 연속 함수에 매핑합니다.
예:
사람의 사진이 주어지면 나이를 예측하십시오.
분류 : 결과를 예측하여 이산 출력 => 입력 변수를 이산 범주로 매핑
예:
이 튜 머는 암성입니까?
비지도 학습 :
비지도 학습은 분류, 분류 또는 분류되지 않은 테스트 데이터를 통해 학습합니다. 비지도 학습은 데이터의 공통성을 식별하고 각각의 새 데이터 조각에서 이러한 공통성의 존재 여부에 따라 반응합니다.
데이터의 변수 간 관계를 기반으로 데이터를 클러스터링하여이 구조를 도출 할 수 있습니다.
예측 결과에 따른 피드백이 없습니다.
문제의 범주 :
클러스터링 : 동일한 그룹 (클러스터라고 함)의 개체가 다른 그룹 (클러스터)의 개체와 더 유사하게 (클러스터라고 함) 개체 집합을 그룹화하는 작업입니다.
예:
1,000,000 개의 서로 다른 유전자를 모아서 수명, 위치, 역할 등과 같은 다른 변수에 의해 유사하거나 관련이있는 그룹으로 이들 유전자를 자동으로 그룹화하는 방법을 찾으십시오 .
인기있는 사용 사례는 다음과 같습니다.
데이터 마이닝에서 분류와 클러스터링의 차이점은 무엇입니까?
참고 문헌 :
지도 학습
비지도 학습
예:
지도 학습 :
오렌지 한 봉지
=> 빌드 모델
사과와 오렌지의 혼합 가방.
=> 분류하십시오
비지도 학습 :
사과와 오렌지의 혼합 가방.
=> 빌드 모델
다른 혼합 가방
=> 분류하십시오
지도 학습
지도 학습은 원시 입력의 출력을 알 수있는 곳입니다. 즉, 머신 학습 모델을 훈련하는 동안 제공 결과에서 감지해야 할 내용을 이해하고 훈련하는 동안 시스템을 안내 할 수 있도록 데이터에 레이블이 지정됩니다. 사전 레이블이 지정된 객체를 기반으로 감지하여 교육에서 제공 한 유사한 객체를 감지합니다.
여기서 알고리즘은 데이터의 구조와 패턴이 무엇인지 알게됩니다. 지도 학습은 분류에 사용됩니다
예를 들어, 모양이 정사각형, 원, 삼각형 인 다른 객체를 가질 수 있습니다. 우리의 임무는 레이블이 지정된 데이터 집합에 모든 레이블이 지정된 동일한 유형의 모양을 정렬하는 것입니다. 훈련 날짜를 기준으로 도형 감지를 시작합니다.
비지도 학습
비지도 학습은 최종 결과를 알 수없는 안내되지 않은 학습으로, 데이터 세트를 클러스터링하고 객체의 유사한 속성을 기반으로 객체를 여러 묶음으로 나누고 객체를 감지합니다.
여기서 알고리즘은 원시 데이터에서 다른 패턴을 검색하고이를 기반으로 데이터를 클러스터링합니다. 비지도 학습은 클러스터링에 사용됩니다.
예를 들어, 여러 모양의 사각형, 원, 삼각형의 서로 다른 객체를 가질 수 있으므로 객체 속성을 기반으로 묶음을 만듭니다 .4면이 있으면 사각형으로 간주하고 3면이 삼각형이면 원 이외의면이 없으면 여기에 데이터에 레이블이 지정되지 않고 다양한 모양을 감지하는 방법을 배우게됩니다.
기계 학습은 인간 행동을 모방하기 위해 기계를 만들려고하는 분야입니다.
아기처럼 기계를 훈련시키는 방법 인간이 다양한 특징을 가진 데이터를 공급함으로써 기계를 훈련하는 것과 같은 방식으로 인간이 배우고, 특징을 식별하고, 패턴을 인식하고, 스스로 훈련하는 방식. 머신 알고리즘은 데이터 내에서 패턴을 식별하여 특정 카테고리로 분류합니다.
기계 학습은 크게지도 및 비지도 학습의 두 가지 범주로 나뉩니다.
지도 학습은 해당 목표 값 (출력)이있는 입력 벡터 / 데이터가있는 개념이며,지도 학습은 해당 목표 값이없는 입력 벡터 / 데이터 만있는 개념입니다.
지도 학습의 예는 해당 숫자가 [0-9] 인 숫자 이미지가있는 자필 숫자 인식이며,지도 학습이 아닌 예는 구매 행동으로 고객을 그룹화하는 것입니다.