데이터를 시각화하는 올바른 방법을 선택하는 데 어려움이 있습니다. 하자 우리가 가지고 있다고 서점 판매 책을 , 모든 책은 적어도 하나이 개 범주를 .
서점의 경우 모든 서적 범주를 세면 해당 서점의 특정 범주에 해당하는 서적 수를 보여주는 히스토그램을 얻습니다.
서점 행동을 시각화하고 싶습니다. 다른 카테고리보다 카테고리를 선호하는지 확인하고 싶습니다. 나는 그들이 공상 과학을 모두 선호하는지보고 싶지 않지만 모든 카테고리를 동등하게 취급하는지 여부를보고 싶습니다.
~ 1M 서점이 있습니다.
나는 4 가지 방법을 생각했다.
데이터를 샘플링하고 500 개의 서점 히스토그램 만 표시하십시오. 10x10 격자를 사용하여 5 개의 별도 페이지에 표시하십시오. 4x4 그리드의 예 :
# 1과 같습니다. 그러나 이번에는 x 축 값을 카운트 디스크에 따라 정렬하므로 선호가 있으면 쉽게 볼 수 있습니다.
히스토그램을 # 2에 데크처럼 모아서 3D로 표시한다고 상상해보십시오. 이 같은:
히트 맵 (2D 히스토그램)을 사용하여 색상을 나타내는 데 세 번째 축 색상을 사용하는 대신 :
일반적으로 서점에서 다른 카테고리를 선호하는 경우 왼쪽에서 오른쪽으로 멋진 그라디언트로 표시됩니다.
여러 히스토그램을 나타내는 다른 시각화 아이디어 / 도구가 있습니까?