잠재 기능의 의미?


15

추천 시스템의 매트릭스 인수 분해 모델을 이해하려고 노력하고 있으며 항상 '잠재적 기능'을 읽습니다. 그러나 그 의미는 무엇입니까? 기능이 교육 데이터 세트에 어떤 의미가 있는지 알고 있지만 잠재 기능에 대한 아이디어를 이해할 수 없습니다. 내가 찾을 수있는 주제에 대한 모든 문서는 너무 얕습니다.

편집하다:

적어도 아이디어를 설명하는 논문을 알려 주시면됩니다.


답변:


9

잠복은 직접 관찰 할 수 없음을 의미합니다. PCA 및 요인 분석에서이 용어의 일반적인 사용은 다수의 직접 관찰 가능한 특징의 차원을 더 작은 간접적으로 관찰 가능한 특징으로 축소하는 것입니다.


축소 된 치수는 잠복 한 특징입니까? PCA의 경우 공분산 행렬의 고유 벡터, 즉 주성분은 무엇입니까?
Jack Twain

@AlexTwain 수정
samthebest

저를 언급하는 튜토리얼 / 종이를 제공해 주시겠습니까? 체계적인 튜토리얼 / 종이를 찾을 수 없습니다!
Jack Twain

wiki 페이지는 꽤 좋습니다. en.wikipedia.org/wiki/Latent_variable
samthebest

1
@JackTwain 올바른 PCA 비유는 잠재적 특징이 고유 벡터라는 것입니다. 주성분은 주 고유 벡터에 대한 각 관측치에 할당 된 가중치입니다. 다른 행렬 인수 분해 모델에서 잠재 특징은 고유 벡터의 역할을합니다. 이것은 농담처럼 들릴지 모르지만, 실수는 사람들에게 혼란을 종식시키지 않습니다.
추측 :

3

인수 분해 방법의 맥락에서 잠재 특징은 일반적으로 각 차원을 따라 항목을 특성화하기위한 것입니다. 예를 들어 설명하겠습니다.

RRuipuTqipuuqii

puqi


잠재 기능 (예 : "사용자 벡터")이 일부 대상 변수를 예측하는 데 사용되는 논문을 읽었습니다. 성별을 예로 들어 봅시다. 예측 모델을 이런 식으로 구축 할 수 있다는 점에서 "작동"합니다. 내 질문은 "사용자 벡터"와 사용자가 "방문한"모든 항목에 대해 "항목 벡터"를 평균화하는 것의 차이점은 무엇입니까? IOW, 위에서 언급 한 예측 모델이 다른 것보다 나아질 것으로 기대하십니까? 감사합니다 (이것이 보이면).
thecity2

@ thecity2를 사용하면 사용자 항목의 평균을 계산할 수 있으며 사전 계산 된 사용자 벡터가없는 신규 사용자를 처리 할 때 실제로 유용 할 수 있습니다 (작은 최적화 반복을 실행하여 계산하기는 어렵지만). 일반 평균화와 관련된 문제도 있습니다. 사용자가 더 많이 소비 한 항목 – 평균 L2 정규화 기 및 고차원 공간의 다른 불쾌한 속성 때문에 평균 항목 벡터가 0에 가까울 수 있습니다. 마지막으로 별도의 벡터를 사용하는 것이 더 유연합니다. 모델에서 이러한 평균을 학습 할 수 있습니다.
Artem Sobolev

즉, 사용자 히스토리를 사용하여 사용자 벡터를 모델링하려는 시도가 있습니다. 예를 들어, "인터넷 라디오 스트림을 모델링하여 나만의 음악 추천사 만들기"
Artem Sobolev를 참조하십시오.

0

변수의 '대기 시간'/ 숨김에 대한 인식을 얻는 요소는 주요 구성 요소보다 더 대표적이라고 말하고 싶습니다. 지연 시간은 행동 과학자들이 여러 항목 / 측정 항목의 느낌, 슬픔과 같은 지각 적 구성을 측정하고 직접 측정 할 수없는 숨겨진 변수에 대한 숫자를 도출하는 이유 중 하나입니다.


0

여기에서 귀하의 데이터는 다양한 사용자가 다양한 영화에 대한 등급입니다. 다른 사람들이 지적했듯이 잠복은 직접 관찰 할 수 없습니다.

영화의 잠재 특징에 따라 액션의 양, 로맨스, 스토리 라인, 유명한 배우 등이 결정됩니다. 마찬가지로 필기 숫자로 구성된 다른 데이터 세트의 경우 잠재 변수는 가장자리 각도, 기울기 등일 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.