답변:
LSA와 LSI는 대부분 동의어로 사용되며 정보 검색 커뮤니티는 일반적으로 LSI라고합니다. LSA / LSI는 SVD를 사용하여 용어 문서 행렬 A를 용어 개념 행렬 U, 특이 값 행렬 S 및 개념 문서 행렬 V로 A = USV '형식으로 분해합니다. 위키 백과 페이지에는 잠재 의미 체계 색인에 대한 자세한 설명이 있습니다.
특히 LSA와 LSI가 SVD를 사용하여 마법을 수행하는 동안 HAL (Hyperspace Analogue to Language)이라는 계산적으로 개념적으로 간단한 방법이 있으며 텍스트를 통해 이전 및 이후 컨텍스트를 추적합니다. 이들 (종종 가중 된) 동시 발생 행렬로부터 벡터가 추출되고, 의미 공간을 인덱스하기 위해 특정 단어가 선택된다. 여러 가지면에서 SVD의 수학적 / 개념적으로 복잡한 단계를 요구하지 않고도 LSA뿐만 아니라 성능도 이해할 수 있습니다. 자세한 내용은 Lund & Burgess, 1996를 참조하십시오.