나는 그것을 직접 사용하지 않았기 때문에 내가 가지고있는 몇 가지 논문과 그 기술에 대한 일반적인 생각 (주로 귀하의 질문 1과 3을 다루는 것) 만 공유 할 수 있습니다.
biclustering에 대한 나의 일반적인 이해는 주로 유전자 클러스터와 개인의 그룹화를 설명하려는 유전자 연구 (2-6)에서 비롯됩니다. 예를 들어 질병 상태) 및 이러한 패턴의 유전자 프로파일 링에 기여하는 유전자. 생물학적 "대량"데이터 세트에 대한 최신 기술에 대한 설문 조사는 Pardalos의 슬라이드 인 Biclustering 에서 볼 수 있습니다 . 마이크로 어레이 데이터에 적용 할 수 있는 R 패키지 biclust가 있습니다.
사실, 내 초기 아이디어는 증상이 클러스터가 함께 정의 할 수 있음을하기 때문에 semeiological perpective에서 재미 이상의 클러스터의 기능 또는 변수를 넣을 수 있기 때문에, 임상 진단에이 방법을 적용했다 증후군을 하지만, 일부 증상은 수 다른 질병에 겹칩니다. 좋은 논의는 Cramer et al., Comorbidity : A network perspective (Behavioral and Brain Sciences 2010, 33, 137-193)에서 찾을 수 있습니다.
다소 관련된 기술은 협업 필터링 입니다. Su와 Khoshgoftaar ( Advances in Artificial Intelligence , 2009) : Collaborative Filtering Techniques의 조사에 의해 좋은 검토가 이루어졌다 . 다른 참조는 끝에 나열되어 있습니다. 시장 바구니 문제 에서 예시 한 것처럼 빈번한 항목 집합 분석 도 이와 관련이있을 수 있지만 조사한 적이 없습니다. 공동 클러스터링의 또 다른 예는 텍스트 마이닝과 같이 단어와 문서를 동시에 클러스터링하려는 경우입니다 (예 : Dhillon (2001)). 2 분자 스펙트럼 그래프 파티셔닝을 사용하여 문서 및 단어를 공동 클러스터링합니다 . Proc. KDD , 269–274 쪽.
몇 가지 일반적인 참고 자료에 대해 다음은 유용한 목록이 아닙니다.
- Jain, AK (2010). 데이터 클러스터링 : K- 평균 이상의 50 년 . 패턴 인식 문자 , 31 , 651–666
- Carmona-Saez et al. (2006). 비 부드러운 비 음성 매트릭스 인수 분해에 의한 유전자 발현 데이터의 비 클러스터링 . BMC Bioinformatics , 7 , 78.
- Prelic et al. (2006). 유전자 발현 데이터에 대한 biclustering 방법의 체계적인 비교 및 평가 . 생물 정보학 , 22 (9) , 1122-1129. www.tik.ee.ethz.ch/sop/bimax
- DiMaggio et al. (2008). 시스템 생물학에서 데이터 매트릭스의 최적 재정렬을 통한 Biclustering : 엄격한 방법 및 비교 연구 . BMC Bioinformatics , 9 , 458.
- 산타 마리아 (Santamaria) 등. (2008). BicOverlapper : 바이 클러스터 시각화 도구 . 생물 정보학 , 24 (9) , 1212-1213.
- 생물학적 데이터 분석을위한 Madeira, SC 및 Oliveira, AL (2004) Bicluster 알고리즘 : 조사 . IEEE Trans. 계산. Biol. 생물 정보. , 1 , 24–45.
- Badea, L. (2009). 겹치는 바이커에 대한 일반화 된 클러스터 그램 . IJCAI
- Symeonidis, P. (2006). 가장 가까운 클러스터 러 협업 필터링 . WEBKDD