(왜) 코오 넨 스타일의 SOM이 유리하지 않았습니까?


33

내가 알 수있는 한, Kohonen 스타일의 SOM은 2005 년경에 피크를 기록했으며 최근에는 호의를 얻지 못했습니다. 나는 SOM이 다른 방법에 의해 포섭되었거나 다른 방법과 동등한 것으로 입증되었다는 논문을 찾지 못했습니다 (어쨌든 더 높은 차원에서). 그러나 tSNE 및 기타 방법은 오늘날 Wikipedia 또는 SciKit Learn에서 요즘 훨씬 더 많은 잉크를 얻는 것처럼 보이며 SOM은 역사적 방법으로 더 많이 언급됩니다.

(실제로, Wikipedia 기사는 SOM이 경쟁사에 비해 계속해서 특정 이점을 가지고 있음을 나타내지 만 목록에서 가장 짧은 항목이기도합니다. 편집 : gung의 요청에 따라 내가 생각하고있는 기사 중 하나는 다음과 같습니다. 비선형 차원 축소 SOM은 다른 방법보다 그에 대해 적은 글을 썼다는 점에 유의하십시오.

통찰력이 있습니까? 다른 사람이 왜 SOM이 사용되지 않는지 묻고 얼마 전에 참고 자료를 얻었지만 SOM 회의에서 진행 상황을 발견했지만 SVM 또는 tSNE의 상승 등이 팝 머신 학습에서 SOM을 막았는지 궁금했습니다.

편집 2 : 순수한 우연의 일치로 오늘 저녁 비선형 차원 축소에 대한 2008 년 설문 조사를 읽었으며 예를 들어 Isomap (2000), 로컬 선형 임베딩 (LLE) (2000), Hessian LLE (2003), Laplacian 고유 맵 (2003) 및 반정의 임베딩 (SDE) (2004).


3
당신이 언급하고있는 자료들 중 어떤 것에 링크 할 수 있습니까? (예 : 어느 위키 백과 기사가 "..."으로 표시되는 것 같습니까?)
gung-Monica Monica 복원

11
그들은 내가 SOM이 무엇을 의미하는지 알지 못할 정도로 호의적이지 않은 것 같습니다.
Matthew Drury

5
분명히, 자기 조직지도
Christoph Hanck

SOM은 훨씬 오래된 다차원 스케일링 (MDS)의 변형 일뿐입니다.
kjetil b halvorsen

@kjetilbhalvorsen : SOM 및 MDS에 대한 참조가 있습니까? 내가 이해하는 바와 같이, MDS는 본질적으로 전 세계 (PCA와 관련됨) 인 반면 SOM은 본질적으로 지역적입니다. 아니면 내가 그들을 오해 할 수도 있습니다.
Wayne

답변:


18

머신 러닝이 현재 차원 축소를위한 '최고의'알고리즘으로 선전하는 것의 영향을 주목함으로써 당신이 무언가에 있다고 생각합니다. 머크 비즈 챌린지 (Merck Viz Challenge) 와 같은 경쟁에서 t-SNE가 그 효능을 보인 반면 , 필자는 개인적으로 기능 추출 및 이진 분류를 위해 SOM을 구현하는 데 성공했습니다. 알고리즘의 시대 외에 정당화없이 SOM을 기각하는 사람들도 있지만 (이 토론을 확인하십시오 .) 지난 몇 년 동안 SOM을 구현하고 긍정적 인 결과를 얻은 여러 기사도 있습니다 ( Mortazavi et al., 2013 ; Frenkel et al., 2013예를 들어). Google 학술 검색에서 SOM이 여전히 여러 응용 프로그램 도메인 내에서 사용되고 있음이 밝혀졌습니다. 그러나 일반적으로 특정 작업에 가장 적합한 알고리즘은 정확히 특정 작업에 가장 적합한 알고리즘입니다. 임의의 포리스트가 특정 이진 분류 작업에서 잘 작동했을 경우 다른 포리스트에서는 끔찍하게 수행 될 수 있습니다. 클러스터링, 회귀 및 최적화 작업에도 동일하게 적용됩니다. 이 현상은 ' 무료 점심 식사 정리 (No Free Lunch Theorem)' 와 관련이 있지만 이는 또 다른 토론 주제입니다. 요컨대, SOM이 특정 작업에 가장 적합한 경우 인기있는 항목에 관계없이 해당 작업에 사용해야하는 알고리즘입니다.


5

SOM과 t-SNE 등을 비교하는 연구를 수행했으며 새로운 수준의 효율성으로 끌어 올릴 수있는 SOM 개선을 제안했습니다. 여기를 확인하여 의견을 알려주십시오. 사람들이 그것에 대해 어떻게 생각하는지 그리고 사람들이 사용할 수 있도록 파이썬으로 출판 할 가치가 있는지에 대한 아이디어를 얻고 싶습니다.

종이에 대한 IEEE 링크 : http://ieeexplore.ieee.org/document/6178802/

Matlab 구현. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinforcement--cr--phase

의견을 보내 주셔서 감사합니다.


4
Cross Validated에 오신 것을 환영합니다! 발견 한 내용과 개선 사항에 대한 간략한 요약을 제공하고 질문을보다 직접적으로 해결하는 데 도움이됩니다.
Scortchi-Monica Monica 복원

1

저의 주관적인 견해는 SOM이 다른 많은 방법들보다 덜 '섹시한'것으로 잘 알려져 있지 않고 인식되지만 여전히 특정 종류의 문제와 관련이 있다는 것입니다. 그들이 더 널리 사용된다면 그들이 큰 공헌을했을 것입니다. 다변량 데이터의 '풍경'또는 '토폴로지'에 대한 느낌을 얻는 탐색 적 데이터 과학의 초기 단계에서 매우 중요합니다.

같은 라이브러리의 개발 Somoclu 하고는에 의해 그 같은 연구 Guénaël Cabanes SOMS 여전히 관련이 있음을 보여줍니다 (많은 다른 사람의 사이에서).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.