많은 세트의 교차점 시각화


30

여러 세트의 교차점 겹침을 표시하는 데 적합한 시각화 모델이 있습니까?

나는 Venn 다이어그램과 같은 것을 생각하고 있지만 어떻게 든 10 개 이상의 많은 세트에 더 잘 빌려 줄 수 있습니다. Wikipedia는 더 높은 세트의 벤 다이어그램을 보여 주지만 4 세트의 다이어그램조차도 많이 사용됩니다.

데이터의 최종 결과에 대한 나의 추측은 많은 세트가 겹치지 않을 것이므로 Venn 다이어그램은 괜찮을 것입니다. 그러나 그것을 생성 할 수있는 컴퓨터 도구를 찾고 싶습니다. Google 차트에서 많은 세트를 허용하지 않는 것처럼 보입니다.


1
관련이 있지만 적은 수의 세트 (참조 용) : stats.stackexchange.com/questions/4211/…

답변:


18

많은 수의 집합이있는 경우 더 선형적이고 링크를 직접 보여주는 네트워크 그래프와 같은 것을 시도합니다. Flare와 Protovis에는 이러한 시각화를 처리하는 유틸리티가 있습니다.

다음 과 같은 몇 가지 예이 질문을 참조하십시오 .

대체 텍스트


(+1) 좋은 답변입니다! -나는 특히 그래픽을 좋아한다. R에 이것을 할 수있는 방법이 있는지 궁금합니다.
suncoolsu

1
나는 그것을 할 방법을 모른다. 내 webvis 패키지는 Protovis에 대한 래퍼를 제공하지만이 그래픽을 만드는 데 많은 작업이 필요합니다. 덧붙여서,이 논문은 관련된 "arc diagram"을 소개합니다 : ieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/papers/…
Shane

1
@suncoolsu, R 패키지 다이어그램은 Shane이 가리키는 동일한 "arc diagram"을 수행 할 수 있습니다. 그래도 "플롯 웹"을 시각적으로 보이게하는 것은 어려운 일처럼 보입니다. cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf .
Andy W

앤디. 답변 주셔서 감사합니다. @Shane, 나는 당신의 webvis 패키지를 보았습니다. 그러나 나는 아직도 그것을 더 탐구해야합니다. 나는 protovis 그래프를 많이 좋아합니다. 그들은 훌륭한 웹 사이트를 가지고 있습니다.
suncoolsu

1
멋진 그래프이지만 3 개 이상의 집합의 교차점을 나타낼 수 없으므로 초기 질문에 대답하지 않습니다. 그것의 변형이 있습니까?
nassimhddd

11

원형 디스플레이는 고차원 데이터 세트와 복잡한 관계를 표시하는 데 실제로 적합하기 때문에 @Shane의 답변과 경쟁하지 않습니다.

venn()K=4

K=4

자세한 내용은 다음을 참조하십시오.

Kestler et al., Generalized Venn diagrams : 복잡한 유전자 집합 관계를 시각화하는 새로운 방법 , Bioinformatics, 21 (8), 1592-1595 (2004).

벤 다이어그램에는 한계가 있습니다. 이 점에서, 나는에 로버트 코 사라 취한 접근 방식과 같은 목격하십시오 Vennerable 도전 , 또는과 병렬 세트 (뿐만 아니라 볼 이 토론 앤드류 겔만 웹 로그에 참조).


좋아 보인다. 그것이 숫자가 아닌 것을 받아들이면 그것을 좋아했을 것입니다. 먼저 데이터를 숫자 목록으로 변환해야합니다.
eastafri

실용적인 목적으로, 일부
화면 캡처

7

UpSet이라는 집합 교차점에 대한 매트릭스 기반 접근 방식을 개발했습니다 . http://vcg.github.io/upset/ 에서 확인할 수 있습니다 . 예를 들면 다음과 같습니다.

UpSet 스크린 샷

왼쪽의 매트릭스는 행이 나타내는 교차점을 나타냅니다. 여기에서 마지막 행은 "액션, 어드벤처 및 어린이"영화 장르의 교차점입니다. 오른쪽의 막대는이 예에서 교차점의 크기를 나타냅니다.

교차점이나 다른 선택 등의 속성을 플롯 할 수도 있습니다. 자세한 내용은 웹 사이트를 확인하십시오.

위에서 언급 한 웹 사이트에서 찾을 수 있거나 https://github.com/hms-dbmi/UpSetR/ 에있는 R 용 정적 버전도 있습니다.

세트 시각화에 대한 최신 보고서는 http://www.cvast.tuwien.ac.at/SetViz 에서 액세스 할 수 있습니다. 이들 중 대부분은 학술 용이지만 쉽게 구할 수있는 코드가 제공되지 않습니다.


1
나에 관해서는 당신이 게시 한 이미지는 하나의 음모에 너무 많은 정보가 채워져있는 오버 플로팅의 예입니다 ...
Tim

1
@ 팀. 나는 당신이 말하는 것을 이해하지만 모든 시각적 요소가 명확하게 보이고 분리되어 있기 때문에 실제로 과도하게 쓰이지 않습니다. 음모가 쉽게 식별하기에는 너무 복잡하다고 주장 할 수 있지만 음모를 사용하여 훈련받지 않은 것과 관련이있을 수 있습니다. 단순화가 종종 제한된 범위로 이어 지므로 모든 시각화가 훈련받지 않은 사용자를 대상으로 할 수는 없습니다. 벤 다이어그램의 가난한 확장 성)
ThomasP85

@ ThomasP85 파이 차트와 같은 기본 항목을 포함하여 플롯 ( "전문가"전문가)의 시각적 해석 이 실제로 나쁜 것으로 나타났습니다 . 대부분의 경우 복잡한 시각화는 오해와 오해로 이어집니다.

@Tim 나는 단순한 것이 항상 더 낫다는 데 동의하지만 복잡한 질문에는 때로는 복잡한 답변이 있습니다. 이 질문이 처음에 제기 된 이유는 현재까지 많은 수의 교차로를 다루는 강력하고 간단한 시각화 기술이 아니기 때문입니다. 허용되는 답변은 세트의 수가 증가함에 따라 총 교차 수의 점점 더 작은 부분 인 2도 교차에만 관련됩니다.
ThomasP85

... 원형 차트를 사용한 예는 각도를 비교할 때 인간 (전문가 여부)이 끔찍하다는 사실과 관련이 있습니다. 그래서 원형 차트를 사용해서는 안됩니다 :-)
ThomasP85
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.