답변:
Toros가 제공 한 답변에
이 (아래 글 머리 기호 참조) 3은 매우 유사하지만 미묘한 차이점이 있습니다.
특징 추출 및 특징 공학 : 원시 데이터를 모델링에 적합한 특징으로 변환;
특징 변환 : 알고리즘의 정확성을 향상시키기 위해 데이터의 변환;
기능 선택 : 불필요한 기능 제거.
같은 예제를 추가하기 만하면
특징 추출 및 엔지니어링 (우리는 그들로부터 무언가를 추출 할 수 있음)
기능 변형 (이해하기 위해 변형)
기능 선택 (선택된 기능을 사용하여 모델 작성)
도움이 되었기를 바랍니다...
다른 사람들이 공유 한 링크를보십시오. 그들은 아주 좋은 ...
Aditya가 말했듯이 때로는 서로 혼동되는 3 가지 기능 관련 용어가 있습니다. 나는 그들 각자에게 요약 설명을 시도 할 것입니다 :
기존 데이터 세트의 차원 축소 만 달성하려는 경우 피쳐 변환 또는 피쳐 선택 방법을 사용할 수 있습니다. 그러나 "중요"한 것으로 식별 된 기능의 물리적 해석을 알아야하거나 분석을 위해 수집해야하는 데이터의 양을 제한하려는 경우 (기능 변환을위한 모든 초기 기능 세트가 필요함), 기능 선택 만 가능합니다.
기능 선택 및 차원 축소 에 대한 자세한 내용 은 다음 링크를 참조하십시오.
나는 그들이 다른 두 가지라고 생각합니다.
기능 선택으로 시작합니다 .
이 기법은 목표 변수를 가장 많이 설명하는 기능을 선택하는 데 사용됩니다 (목표 변수와 상관 관계가 있음).이 테스트는 모델이 데이터에 적용되기 직전에 실행됩니다.
더 잘 설명하기 위해 10 개의 특징과 1 개의 목표 변수가 있으며, 9 개의 특징은 목표 변수의 90 %를 설명하고 10 개의 특징은 목표 변수의 91 %를 설명합니다. 따라서 1 변수는 큰 차이를 일으키지 않으므로 모델링하기 전에 제거하는 경향이 있습니다 (비즈니스에도 주관적입니다). 또한 예측 자 중요도라고도합니다.
이제 특징 추출 에 대해 이야기하겠습니다 .
비지도 학습, 이미지의 윤곽 추출, 텍스트에서 Bi-gram 추출, 음성 텍스트 녹음에서 음소 추출에 사용됩니다. 데이터 사전이없는 것과 같이 데이터에 대해 아무것도 모르는 경우 데이터가 이해할 수없는 형식이 아닌 기능이 너무 많습니다. 그런 다음이 기술을 적용하여 대부분의 데이터를 설명하는 기능을 사용하십시오. 형상 추출에는 형상 변환이 포함되는데, 이는 치수 축소 프로세스에서 일부 정보가 손실되기 때문에 되돌릴 수없는 경우가 많습니다.
주어진 데이터에 피쳐 추출을 적용하여 피쳐를 추출한 다음 대상 변수와 관련하여 피쳐 선택을 적용하여 좋은 결과로 좋은 모델을 만드는 데 도움이되는 하위 세트를 선택할 수 있습니다.
더 나은 이해 를 위해이 Link-1 , Link-2 를 살펴볼 수 있습니다.
R, Python, SPSS로 구현할 수 있습니다.
더 자세한 설명이 필요하면 알려주십시오.
머신 러닝 프로젝트 성공의 중요한 부분은 훈련 할 훌륭한 기능 세트를 제공하는 것입니다. 기능 엔지니어링이라고하는이 프로세스에는 다음이 포함됩니다.
• 기능 선택 : 기존 기능 중에서 가장 유용한 기능을 선택합니다.
• 기능 추출 : 기존 기능을 결합하여보다 유용한 기능을 생성합니다 (앞서 살펴본 것처럼 차원 축소 알고리즘이 도움이 될 수 있음).
• 새로운 데이터를 수집하여 새로운 기능 생성
인용 : "SciKit-Learn, Keras & Tensorflow를 이용한 머신 러닝 실습-Aurelien Geron"