기능과 레이블의 차이점은 무엇입니까?


100

기계 학습 기본 사항에 대한 자습서 를 따르고 있으며 기능 또는 레이블이 될 수 있다는 언급이 있습니다 .

내가 아는 한 기능은 사용중인 데이터의 속성입니다. 레이블이 무엇인지 알 수없고 단어의 의미를 알고 있지만 기계 학습의 맥락에서 그것이 무엇을 의미하는지 알고 싶습니다.


기능은 입력으로 사용되는 필드이고 레이블은 출력으로 사용됩니다. 간단한 예로, 자동차 마일리지, 연도 등을 기준으로 자동차를 판매해야하는지 여부를 예측하는 방법을 고려하십시오. 예 / 아니오가 레이블이고 마일리지와 연도가 기능입니다.
amcneil206

답변:


200

간단히 말해서 기능이 입력됩니다. 라벨이 출력됩니다. 이것은 분류 및 회귀 문제 모두에 적용됩니다.

특성은 입력 세트에있는 데이터의 한 열입니다. 예를 들어, 누군가 선택할 애완 동물의 유형을 예측하려는 경우 입력 기능에는 나이, 거주 지역, 가족 소득 등이 포함될 수 있습니다. 레이블은 개, 물고기, 이구아나, 바위, 기타

모델을 학습 한 후에는 이러한 기능을 포함하는 새로운 입력 세트를 제공합니다. 그 사람에 대해 예측 된 "라벨"(애완 동물 유형)을 반환합니다.


1
따라서 [연령, 거주 지역, 가족 소득]은 "3 가지 특징 벡터"가됩니다. 그리고 Keras에서 LSTM 네트워크에 대한 NumPy 배열은 [samples, time steps, 3]?
naisanza

1
@naisanza : 그것은 확실히 하나의 가능성입니다. 저는 Keras에 익숙하지 않지만이 높은 수준의 조직은 확실히 유효한 구현의 시작일 수 있습니다.
Prune

기능과 변수는 같은 것입니까?
Debadatta 2018

"라벨"도 문맥에 따라 달라진다고 말하고 싶습니다. 예를 들어 모델 학습을 위해 "라벨이 지정된"데이터를 사용합니다. 이 경우 레이블은 출력 데이터가 비교되는 기준 진실입니다.
N.Atanasov

와. 훌륭한 답변입니다.이 주제 공간에 대한 많은 질문을 해결해 주셔서 감사합니다.
Andrew Ray

31

특색:

기계 학습에서 기능은 학습 데이터의 속성을 의미합니다. 또는 학습 데이터 세트의 열 이름을 말할 수 있습니다.

이것이 훈련 데이터 세트라고 가정하십시오.

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

그리고 여기 Height, Sex그리고 Age특징이다.

상표:

학습 후 모델에서 얻은 출력을 레이블이라고합니다.

위의 데이터 세트를 일부 알고리즘에 공급하고 성별을 남성 또는 여성으로 예측하는 모델을 생성한다고 가정합니다. 위 모델에서는 age, height등과 같은 기능을 전달합니다 .

따라서 계산 후 성별을 남성 또는 여성으로 반환합니다. 그것을 레이블 이라고합니다.


5

개념을 설명하기위한보다 시각적 인 접근 방식이 있습니다. 사진에 표시된 동물을 분류하고 싶다고 가정 해보십시오.

가능한 종류의 동물은 예를 들어 고양이 또는 새입니다. 이 경우 레이블 은 기계 학습 알고리즘이 예측할 수있는 가능한 클래스 연관 (예 : 고양이 또는 새)이됩니다.

기능은 패턴, 색상, 이미지 등 furr, 깃털, 또는 더 낮은 수준의 해석, 픽셀 값의 일부 형태이다.

새 라벨 :
특징 : 깃털

고양이

라벨 : 고양이
특징 : 모피


5

손으로 쓴 사진을 사용하여 알파벳을 감지하려는 예를 들어 보겠습니다. 우리는 이러한 샘플 이미지를 프로그램에 제공하고 프로그램은 이러한 이미지를 얻은 기능에 따라 분류합니다.

이 맥락에서 특징의 예는 다음과 같습니다. 문자 'C'는 오른쪽을 향하는 오목한 모양으로 생각할 수 있습니다.

이제 이러한 기능을 저장하는 방법에 대한 질문이 생깁니다. 이름을 붙여야합니다. 여기에 존재하는 레이블의 역할이 있습니다. 라벨은 그러한 기능에 주어진 구별 다른 기능에서 그들을.

따라서 기능이 입력으로 제공되면 레이블을 출력으로 얻습니다 .

레이블은 비지도 학습과 관련 이 없습니다 .


4

전제 조건 : 기본 통계 및 ML 노출 (선형 회귀)

문장으로 답할 수 있습니다.

비슷하지만 필요에 따라 정의가 바뀝니다.

설명

내 진술을 설명하겠습니다. 데이터 세트가 있다고 가정하고이를 위해를 고려하십시오 exercise.csv. 데이터 세트의 각 열을 기능이라고합니다. 성별, 나이, 키, 심박수, 체온, 칼로리는 다양한 열 중 하나 일 수 있습니다. 각 열은 고유 한 기능 또는 속성을 나타냅니다.

exercise.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

이해를 굳히고 퍼즐을 풀기 위해 두 가지 다른 문제 (예측 사례)를 살펴 보겠습니다.

CASE1 :이 경우 운동 중 소모 된 칼로리를 예측하기 위해 성별, 키 및 체중을 사용하는 것을 고려할 수 있습니다. 여기서 예측 (Y) 칼로리Label 입니다. 칼로리-x1 : 성별, x2 : 신장 및 x3 : 체중과 같은 다양한 기능을 사용하여 예측하려는 열입니다 .

CASE2 : 두 번째 경우에서는 성별 및 체중을 기능으로 사용하여 Heart_rate를 예측할 수 있습니다. 여기서 Heart_Ratex1 : Gender 및 x2 : Weight 기능을 사용하여 예측 된 레이블 입니다.

위의 설명을 이해하면 더 이상 레이블 및 기능과 혼동하지 않을 것입니다.


3

간단히 설명 된 기능은 시스템에 공급 한 입력이고 레이블은 예상 한 출력입니다. 예를 들어, 키, 털 색깔 등과 같은 강아지의 많은 기능을 제공 했으므로 계산 후 알고 싶은 개의 품종을 반환합니다.


0

기후를 예측하고 싶다면 과거 기후 데이터, 현재 날씨, 온도, 풍속 등의 기능이 제공되고 레이블은 월이 될 것입니다. 위의 조합은 예측을 도출하는 데 도움이 될 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.