잠재적 인 아이디어 중 하나 는 Sankey 다이어그램 을 사용 하여 범주 간 선택 흐름을 문서화하는 것입니다. 내가 말하는 것을 설명하는 두 가지 예가 있습니다.
의견에 표현 된 일부 우려 사항에 대한 업데이트. 병렬 세트 프로그램이 원하는 것을 즉시 수행하는 것으로 보입니다. 아래는 4 가지 범주로 4 개의 임의 변수를 만든 프로그램의 출력입니다. 디스플레이 상단으로 초기화 한 그룹은 다음 카테고리로 순차적으로 나뉩니다. 원하는 분할을 만듭니다.
또한이 그림에서 알 수없는 패키지에는 대화식 기능이있어 범주 중 하나를 마우스로 가리킬 때와 같이 탐색 데이터를보다 쉽게 분석 할 수 있습니다.
동일한 데이터 세트를 Fineo에 업로드하여 여기에서 살펴볼 수 있습니다 . 이름이 dec1
으로 지정된 초기 4 개의 범주 변수 외에 dec4
분할 범주를 검사 할 수있는 연결된 범주도 포함했습니다. exp
접미사가 있는 변수의 명명 규칙 dec
은 이전에 선택한 범주를 연결하여 확장 된 변수 라는 것입니다 . 그래서 dec3_exp12
으로 표시 될 121
경우 dec1 = 1 and dec2 = 2 and dec3 = 1
. ParSet에서 사용할 수있는 동일한 분할 유형 구조를 Fineo에서 만들 수 있지만 이 예제에서는 이상의 노드가 있는 범주를 렌더링하지 못합니다 .43
Fineo abit로 더 놀아 본 후에는 깔끔한 응용 프로그램이지만 실제로 제한적입니다. Parallel Sets는 훨씬 더 많은 기능을 제공하므로 Fineo 앱보다 먼저 확인하는 것이 좋습니다.
ParSets 프로그램이 범주를 하위 집합으로 연속해서 분할하여 검사하는 것보다 훨씬 나은 옵션이라고 생각합니다. 예를 들어, 위와 동일한 임의의 데이터를 사용하여에 대해 decision 2
선택된 범주에 대해 선택된 조건부에서 비율 범주를 그리는 점 그림 이 decision 1
있습니다.
에서 (으) decision 2
로 변경하는 경우에도 동일한 분류를 수행 할 수 decision 3
있지만 초기 상태 decision 1
에 대한 작은 다중 차트를 작성하십시오 .
이 작업을 무한정 계속할 수 있습니다 (아래 참조). 깨달을지도 모르지만 더 많은 패널에 도달하면 상당히 어려울 것입니다. 아래는 요청 된대로 4 가지 연속 카테고리 선택을 시각화 한 것입니다.
앞에서 언급했듯이 그래픽을 여러 범주로 나눌 때의 작은 숫자는 문제가됩니다. 이를 설명하는 한 가지 방법은 크기와 같은 미학을 비율의 기준이되는 기준선에 매핑하는 것입니다. 이로 인해 더 작은 수치를 기준으로 관측치가 축소됩니다. 투명도를 사용할 수도 있습니다 (그러나이 예제에서 과도하게 팔린 점을 구별하기 위해 점을 투명하게 만들었습니다).
일부는 점 플롯이 아닌 노드 구조와 같은 크리스마스 트리를 상상하고 있다고 생각하지만 그러한 그래픽을 만드는 방법을 모르겠습니다. 그래도 같은 압도적 인 문제가 의심 될 것입니다. 이 작은 배수는 나쁘지 않지만 IMO Parallel Sets는 훨씬 직관적이며 시각화에서 분명하지 않은 패턴이 더 분명하다고 생각합니다. 어쩌면 나보다 더 상상력이 강한 누군가가 4 개의 임의 범주보다 더 흥미로운 데이터를 얻을 수 있습니다.