왜 치수 축소가 중요한지 이해할 수 없습니다. 일부 데이터를 가져 와서 차원을 축소하면 어떤 이점이 있습니까?
왜 치수 축소가 중요한지 이해할 수 없습니다. 일부 데이터를 가져 와서 차원을 축소하면 어떤 이점이 있습니까?
답변:
특이 값 분해 (SVD)는 데이터의 차원을 줄이는 것과 다릅니다. 그것은 여기에 가지 않을 훌륭한 속성을 많이 가진 다른 행렬로 행렬을 분해하는 방법입니다. SVD에 대한 자세한 내용은 Wikipedia 페이지를 참조하십시오 .
데이터의 차원을 줄이는 것이 때로는 매우 유용합니다. 관측치보다 더 많은 변수가있을 수 있습니다. 이것은 게놈 작업에서 드문 일이 아닙니다. 예를 들어 소수의 근본 요인에 의해 큰 영향을받는 경우와 매우 밀접한 상관 관계가있는 몇 가지 변수가있을 수 있으며 근본 요인에 대한 근사값을 복구하려고합니다. 주성분 분석, 다차원 스케일링 및 표준 변량 분석과 같은 차원 감소 기술은 다른 방법으로는 얻을 수없는 관측치 및 / 또는 변수 간의 관계에 대한 통찰력을 제공합니다.
구체적인 예 : 몇 년 전에 100 개가 넘는 질문이있는 직원 만족도 조사를 분석하고있었습니다. 글쎄, 어떤 관리자도 100 개가 넘는 질문에 대한 답을 볼 수 없으며, 요약하고, 그 답이 어떻게 관련되어 있고 누가 무엇을 이끌어 내는지 알 수 있기 때문에 그 의미가 무엇인지 추측 할 수 없습니다. ? 데이터에 대해 요인 분석을 수행 한 결과, 10,000 개가 넘는 관측치가 있었으며, 전체를 요약하는 관리자 별 점수 (각 요인에 대해 하나씩)를 개발하는 데 사용할 수있는 매우 명확하고 쉽게 해석 할 수있는 5 가지 요인이 나타났습니다. 100 개 이상의 질문 설문. 이전의 결과보고 방법이었던 Excel 스프레드 시트 덤프보다 훨씬 나은 솔루션입니다!
문제의 두 번째 요점과 관련하여 데이터 세트의 차원 축소의 이점은 다음과 같습니다.
PCD 이외에도 SVD는 Signals Processing, NLP 등에서 많은 응용 프로그램을 보유하고 있습니다.
이 답변 을 살펴보십시오 . 특이 값 분해는 주요 구성 요소 분석 의 핵심 구성 요소이며 , 이는 매우 유용하고 매우 강력한 데이터 분석 기술입니다.
안면 인식 알고리즘에 자주 사용되며, 제 직장에서 헤지 펀드 분석가로 자주 사용합니다.