명확성을 잃기 전에 그래픽으로 표현할 수있는 변수는 몇 개입니까?


14

내가 가지고있는 이 그래픽 경제 문제를 설명 할 수 있는지 봅시다 . 나는이 분야에 처음 왔고 이것이 순수한 호기심이라는 것을 언급 할 가치가 있으며, 나의 예는-곧 알 수 있듯이 완전히 완성되었다.

그래프가 통신 품질을 잃기 전에 그래픽으로 나타낼 수있는 변수는 몇 개입니까? 예를 들어, 일요일 신문 독자들과 같은 청중을 가정 해 봅시다.

내가이 세트를 가지고 있다고 가정하자 : 몸무게 (x) / 나이 (y), 두 개인 : Jane, 10yo, 30kg; 그리고 20kg, 20kg 인 Joe. 그래픽 표현은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오

이제 원의 크기를 사용하여 다른 변수를 추가 할 수 있다는 것을 알고 있으므로 Jane과 Joe가 일주일에 먹는 햄버거 수 (각각 10과 20)에 대한 표현을 추가하려면 다음과 같이 할 수 있습니다.

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오

그리고 모양이나 색상 + 크기를 사용하여 네 번째 변수를 추가 할 수도 있습니다. 예를 들어 쇠고기 버거보다 치즈 버거를 더 많이 먹는 경우 (버거 유형은 부울이며 두 가지 가능한 값만 있음)

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오

그리고 이것은 내가 더러워지기 시작한다고 생각하는 곳입니다. 다섯 번째 변수를 나타 내기 위해 콤보에 셰이프를 추가하면 그래프의 이해하기 쉬울 수 있습니다. 그래프를 보면 내 (특별한) 뇌는 더 이상 2 개 또는 3 개의 변수 만 처리 할 수 ​​있습니다. 예를 들어 그들은 콤보 또는 햄버거를 먹습니까? :

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오

3 차원이라고 생각했는데 끔찍한 것 같습니다. 나는 이것에 대해 완전히 잘못된 방식으로 생각하고있을 수 있으며, 여기서 이해할 수없는 분명한 것이 빠져있을 가능성이 있습니다 (예 : 3 개 또는 4 개 이상의 변수를 나타내는 것이 실제로 연습으로 잘못 된 경우) 내 질문에 :

  • 4 (그래프가 그래프 와 같이 매우 단순 하면 5 )가 2 축 차트에 동시에 표시되는 최대 변수에 대한 합리적인 수입니까?

  • 명확성을 잃지 않고 더 많은 변수를 허용하는 다른 그래프 유형이 있습니까?

  • 성공적으로 많은 변수를 나타내는 차트의 좋은 예가 있습니까?

답변:


14

편집 III : 다 변수 정량적 데이터 시각화의 놀라운 예를 발견하고 추가해야했습니다. "Edit III (Nobel laureates)"제목 아래에 있습니다.

편집 II : 약간의 오해가 있었으며, 의도 된 데이터 사용을 해석하는 방법을 명확히하기 위해 편집했습니다. 두 개의 이미지를 교체 하고 "그것과 감자 튀김을 원하십니까?" 섹션을 추가했습니다.


그래픽은 데이터를 나타냅니다 .

에드워드 툭테 :

혼란과 혼란은 정보의 속성이 아닌 디자인의 실패입니다. 클러 터는 컨텐츠 축소가 아닌 설계 솔루션을 요구합니다. 의미와 추론이 끊임없이 문맥 적이기 때문에 세부 사항이 강렬할수록 명확성과 이해도가 높아집니다. 적은 구멍입니다.

왜 데이터를 시각화합니까?

  • 사고를위한 도구
  • 강렬한 시청 결과를 보여주기 위해
  • 문제를 이해하고 결정하기
  • 비교 표시, 인과 관계 표시
  • 믿을만한 이유를 제시하십시오

어떻게?

  • 데이터를 보여
  • 시청자에게 방법론, 그래픽 디자인, 그래픽 제작 기술 또는 다른 것에 대한 것이 아니라 물질에 대해 생각하도록 유도
  • 데이터가 말한 것을 왜곡하지 마십시오
  • 작은 공간에 많은 수를 제시하다
  • 대용량 데이터 세트를 일관되게 만들다
  • 눈이 다른 데이터를 비교하도록 장려
  • 광범위한 개요에서 미세 구조에 이르기까지 여러 수준의 데이터를 공개합니다.
  • 설명, 탐사, 표 또는 장식과 같이 합리적으로 명확한 목적을 수행합니다.
  • 데이터 세트의 통계 및 언어 설명과 밀접하게 통합됩니다.

몇 가지 정의 :

데이터:

일반적으로 "데이터베이스에서 정렬 된 항목"으로 생각됩니다. 이것은 물론 숫자, 이미지, 사운드, 비디오 등이 될 수 있습니다. 데이터는 종종 양적으로 수집 가능한 것입니다. 가장 생생한 형태로 소화하기가 어렵습니다. 숫자의 벽. 당신은 알고있다; 매트릭스 . 일반적으로 말하자면, 우리가 가지고 있지 않은 것들이 가장 유익한 것들이더라도, 우리가 가지고 있지 않은 모든 것들에 대해 0으로 구성된 방대한 데이터베이스 는 없습니다 . 그래서 우리는 우리가 무엇을 시각화 할 필요가, 우리가없는 것을 볼 수 않습니다 있습니다.

정보:

데이터에서 추출 할 수있는 것 입니다. 어떻게 든 데이터를 표시함으로써 정보 를 수집 할 수 있습니다 . 내가 자주 사용하는 예 중 하나는 내가 세계의 국가 목록을 제공하고 두 국가가 누락되었다고 말하면 해당 목록을 기반으로 찾을 가능성이 거의 없다는 것입니다. 그러나 내가지도에있는 모든 국가를 색칠하여 이것을 표시하면 중앙 아프리카 공화국과 뉴 칼레도니아가 생략되었음을 즉시 알 수 있습니다. 이것은 "소음 줄이기"이며 가장 효과적인 방법으로 이야기를 전합니다.

인포 그래픽 및 데이터 시각화 :

나는 당신의 예제 인포 그래픽을 부르기를 주저합니다. 나는 이것이 종종 데이터 시각화, 정보 디자인 또는 정보 아키텍처와 동의어로 보인다는 것을 알고 있지만 동의하지 않습니다. 인포 그래픽은 저에게 데이터를 읽는 방법에 대한 여러 가지 편견을 포함 할 수 있는 일련의 그래프, 다이어그램 및 그림 입니다. 제작자의 "관심"에없는 데이터를 건너 뛰는 것은 객관적이지 않으며, 더 쉽게 건너 뛸 수 있습니다. 누군가 미리 정의한 결론을 내립니다. 그들은 엔터테인먼트 가치가 있으며 종종 데이터에서 일부 초점을 벗어난 일러스트레이션을 압도적으로 사용합니다. 이것은 괜찮지 만 조금 차별화해야한다고 생각합니다.

빅 데이터:

빅 데이터는 복잡한 데이터와 동일하지 않습니다. 이 LinkedIn 맵과 같이 많은 데이터가 동일 할 수 있습니다. 핵심 데이터는 동일하지만 태그 가있는 필터있습니다 . 지리와 직업 / 관심사 / 관계로 사람들을 정의하는 일종의 태그라는 두 가지 변수가 있습니다. 미친 양의 데이터; 하지만 두 변수 만 있습니다.

여기에 이미지 설명을 입력하십시오

다 변수 :

다음은 다 변수 데이터 시각화의 예입니다. 나폴레옹의 1812 년 러시아 운동 군의 인원 수, 운동량 및 귀환 경로에서 발생한 온도를 보여주는 Charles Minard의 1869 차트입니다. 여기 큰 버전이 있습니다. 여기에 이미지 설명을 입력하십시오

코드를 해독하는 데 약간의 시간이 걸리지 만 그렇게하면 훌륭합니다. 다루는 변수는 다음과 같습니다.

  • 군대 규모 (생명 / 사망자 수)
  • 지리적 위치
  • 방향 (동서)
  • 온도
  • 시간 (날짜)
  • 인과 관계 (전투와 추위로 사망)

그것은 단순한 2 색지도에서 놀라운 양의 정보입니다. 지리적 부분은 다른 변수에 대한 공간을 제공하기 위해 양식화되었지만 우리는 그것을 얻는 데 아무런 문제가 없습니다.

여기 더 까다로운 것이 있습니다. 기본적인 진화 시각화, 클라도 그램, 계통 발생 및 생물 지리학 원리에 익숙하다면이 방법을 훨씬 쉽게 읽을 수 있습니다. 이것은 익숙한 사람들을 위해 만들어 졌으므로 전문적이고 과학적인 차트입니다. 그 내용은 다음과 같습니다. 독 개구리의 계통 학적 이미지는 남아메리카의 계보입니다. 왼쪽의지도는 시간이 지남에 따라 변화하는 주요 생물 지리적 영역을 보여주고 오른쪽의 이미지는 생물 지리적 기원과 관련하여 개구리 혈통을 보여줍니다. (산토스 JC, Coloma LA, Summers K, Caldwell JP, Ree R 등 [CC-BY-SA-2.5 (www.creativecommons.org/licenses/by-sa/2.5)], Wikimedia Commons를 통해) "코드를 크래킹"하면 매우 놀랍도록 유익합니다.

여기에 이미지 설명을 입력하십시오

작은 배수, 스파크 라인 :

나는 이것을 충분히 강조 할 수 없다 : 반복되는 정보의 가치를 절대 과소 평가하거나 그것을 별도의 동일한 시각화로 나누지 마십시오. 한 그래프를 다른 그래프와 비교하는 것이 합리적으로 쉬운 한, 이것은 완벽합니다. 우리는 패턴 찾기 기계입니다. 이것을 종종 작은 배수라고합니다. 이러한 이미지를 매우 빠르게 분석하는 데는 거의 문제가 없으며 10 개의 작은 이미지가 더 잘 작동 할 때 모든 것을 하나의 큰 그래프로 만드는 것은 무의미합니다.

여기에 이미지 설명을 입력하십시오

다른 것:

여기에 이미지 설명을 입력하십시오

다르지만 반복되는 그래픽을 사용하는 것 :

여기에 이미지 설명을 입력하십시오

스파크 라인 은 Edward Tufte가 만들어 낸 용어이며 , 완벽하게 작동하며 완벽하게 사용자 정의 가능한 Javascript 라이브러리 로 개발되었습니다 . 기본적으로 "외부"개체가 아닌 텍스트의 일부로 텍스트에 삽입 할 수있는 작은 차트입니다. 기본값은 다음과 같습니다. 여기에 이미지 설명을 입력하십시오

편집 III (노벨상 수상자)

방금 찾은이 데이터 시각화를 추가해야했는데 너무 좋았습니다. 노벨상 수상자입니다. 어느 대학, 어떤 교수, 과목, 연도, 나이, 고향, 어느 정도 공유, 학위 수준. 실제로 아름다운 증거. 이들은 모두 정량화 가능한 데이터입니다. 여기 더 있습니다.

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

귀하의 데이터

@Javi 포즈의 모든 질문은 매우 중요합니다.

당신이하려고하는 것은 생각을위한 시각적 도구를 만드는 것입니다. 그러기 위해서는 최상의 신호 대 잡음비를 추출해야합니다. 어려움을 겪고있는 것은 다른 변수를 가진 데이터정보 와 연관시키는 방법 입니다. 여기에 질문이 있습니다 : 대략 옳 아야하는 것과 정확히 옳 아야하는 것은 무엇입니까? 목표는 무엇입니까?

너무 많은 편견없이 데이터를 표시하려고한다고 가정하겠습니다. 상관 관계가있는 경우 독자가 상관 관계를 직접 찾아보기를 원합니다. 당신의 목표는 사람들에게 햄버거가 그들에게 나쁘거나 여성이 남성보다 적은 햄버거를 먹는다는 것을 알리는 것이 아니라 데이터에 포함 된 것이면 (그 세 사람이 가족 이었다면 상상할 수 있도록) "볼"수 있도록하는 것입니다. 햄버거 먹기 그래프 전체에 대한 우리의 견해를 바꾸십시오).

데이터 세트가 너무 작아서 테이블에 모두 넣을 수 있습니다. 물론 이것은 일반적인 아이디어에 관한 것입니다.

약간의 세부 사항 : 시간 (나이)은 왼쪽에서 오른쪽으로 (타임 라인) 수평으로 보이는 경향이 있습니다. 위 아래로 무언가에 무게를두기 때문에 x-y를 전환하는 것이 좋습니다.

1. 고유하고 고정 된 개체는 무엇입니까?

  • 이름

2. (eh ..) 변수 변수는 무엇입니까?

  • 중량 (kg)
  • 연령 (년)
  • 버거 수 (정수)
  • 버거 유형 (정수)

참고 : 데이터는 전적으로 단위로 구성됩니다. 별도의 정신 척도로 각각 계산 가능하고 정량화 할 수 있습니다. 킬로, 나이, 체중 및 숫자. 데이터베이스에서 말하면, 그들의 이름이 열쇠입니다. 시공간 시각화를 시작하면 실제로 두통이됩니다. 출생지, 현재 집 등을 추가해야한다고 상상해보십시오.

여기서 상관 관계 가있는 유일한 것은 햄버거의 수이며 콤보입니다. 다른 모든 변수는 독립적이며 하나만 고정됩니다 (이름). 어느 시점에서 대규모 데이터 세트를 사용하면 이름조차도 흥미롭지 않고 인구 통계, 연령, 성별 등으로 대체됩니다.

작은 데이터 세트를 사용하면 다음과 같이 하나의 그래프로 모든 것을 얻을 수 있습니다. 여기에 이미지 설명을 입력하십시오

또는 축과 이름-버블 내용을 변경할 수 있습니다.

개인 참고 사항 : x와 y에 인간의 "물리적"속성이 포함되어 있기 때문에 이것이 둘 중 더 낫다고 생각합니다. 거품의 변수는 버거의 수입니다.

여기에 이미지 설명을 입력하십시오

그래프 외에도 파이 차트를 추가하거나 파이 차트 만 가질 수도 있습니다. 개인적으로 나는 작은 배수에 대해 언급했듯이 둘 다 가질 것입니다. 여기에 이미지 설명을 입력하십시오

그걸로 감자 튀김을 원하십니까?

내 가정은 햄버거와 식사의 비율을 알고 싶었다는 것입니다. 모든 식사에는 햄버거가 포함되어 있습니다. 모든 식사가 콤보 인 것은 아닙니다.

  1. 사람이 때때로 combomeals를 먹는지 알고 싶습니까?
  2. 아니면 우리는 얼마나 많은 버거 식사가 combomeals 인지 알고 싶습니까?

1이면 이름 / 키 / ID에 부울을 적용한 것입니다.

제인은 때때로 combomeals를 먹는가? 허위 사실.

2 인 경우 식사에 부울을 적용 할 수 있습니다 .

1 치즈 버거, combomeal = true

1 치즈 버거, combomeal = true

치즈 버거 1 개, combomeal = false

치즈 버거 1 개, combomeal = false

치즈 버거 1 개, combomeal = false

치즈 버거 1 개, combomeal = false

치즈 버거 1 개, combomeal = false

1 개의 버거 버거, combomeal = true

1 개의 버거 버거, combomeal = true

1 개의 버거 버거, combomeal = false

매우 지루하므로 다음과 같이 분류 할 수 있습니다.

제인은 햄버거 10 개를 먹습니다. 이 중 3 개는 콤보입니다.

combomeals 중 하나는 비프 버거 메뉴입니다.

combomes 중 두 가지는 치즈 버거 메뉴입니다.

나머지는 싱글 버거입니다. 치즈 5 개, 쇠고기 2 개

이 원형 차트는 그것을 시각화하려는 시도였습니다. 이 버전에서는 파이 조각을 더 선명하게 유지했습니다. 이것에 대한 것은 큰 데이터 세트와 %를 적용하기 시작하는 데 아무런 도약이 없다는 것입니다. 여기에 이미지 설명을 입력하십시오

그러나 가장 좋은 방법은 다시 생각하는 것입니다.

그것을 보는 또 다른 방법은 정말로 간단하게하는 것입니다. 여기에서 연령대, 체중 그룹 및 "보유하지 않은" 모든 데이터 알려주 는 것이 더 쉽습니다 . 당신이 가지고있는 데이터는 공간과 관련이 없으며 단위 (kg, 년, 숫자 + 키 / ID / 이름)입니다.

(편집 : 내 얼굴에 계란 : "모든 식사는 콤보가 아니라 모든 식사는 햄버거입니다"에 관해서는이 이미지를보다 정확한 이미지로 바꿨습니다.

여기에 이미지 설명을 입력하십시오 더 많은 사람들과 함께 확장하는 것은 매우 쉽습니다.

여기에 이미지 설명을 입력하십시오 또는 10 세, 20 세 및 30 세 연령대를 비교하면 통계 시각화를 읽기 매우 간단하게 만들 수 있습니다.

여기에 이미지 설명을 입력하십시오

.. 그리고 가능한 한 명확해야합니다. 다음은 이러한 사고 방식의 예입니다. 이 차트는 타이타닉 생존자, 승무원, 계급, 남성, 여성의 비율을 보여줍니다. 여기에 이미지 설명을 입력하십시오

다른 솔루션이 많이있을 것입니다. 이것은 단지 몇 가지 생각입니다.

나는 계속해서 갈 수 있었지만 이제는 나 자신과 다른 모든 사람들을 지쳤습니다.

가지고 놀 도구 :

지피

Gapminder Hans Rosling 의이 놀라운 TED 프레젠테이션을 보십시오.

구글 차트

솜 비스

라파엘

MIT 전시회 (이전 명칭 Similie)

d3

하이 차트

더 읽을 거리 :

PJ 오 노리; 열심히 방어

Edward Tufte : 아름다운 증거

Edward Tufte : 구상 정보

Edward Tufte : 정량적 정보의 시각적 표시

시각적 설명 : 이미지 및 수량, 증거 및 내러티브

Male, Alan., 2007 이론적이고 상황적인 관점의 그림 Lausanne, Switzerland; 뉴욕, 뉴욕 : AVA 아카데미아

Isles, C. & Roberts, R., 1997. 예술, 과학 및 일상의 가시 광선, 사진 및 분류, 현대 미술관 옥스포드.

Card, SK, Mackinlay, J. & Shneiderman, B. eds., 1999. 정보 시각화의 독해 : 비전을 사용하여 1 차 사고, Morgan Kaufmann.

Grafton, A. & Rosenberg, D., 2010. 시간의지도 제작 : 타임 라인의 역사, 프린스턴 건축 출판사.

Lima, M., 2011. 시각적 복잡성 : 정보의 패턴 매핑, Princeton Architectural Press.

Bounford, T., 2000. 디지털 다이어그램 : 통계 정보를 효과적으로 설계하고 제시하는 방법 0 ed., Watson-Guptill.

Steele, J. & Iliinsky, N. eds., 2010. 아름다운 시각화 : 전문가의 눈을 통해 데이터를 보는 첫 번째 에디션, O'Reilly Media.

Gleick, J., 2011. 정보 : 역사, 이론, 홍수, 판테온


나는 그것을 모두 읽었지만 흡수하는 데 몇 주가 걸릴 것입니다. 당신은 책을 써야합니다!
Joshua Frank

노벨상 이미지의 경우 제작 방법을 알고 있습니까? 흐르는 리본은 아름답습니다.
Joshua Frank

아니, 그녀가 그것을 만들 었는지 정확히 알 수는 없지만, 그녀의 요구 간단하게 시도 할 수 있도록 조르지아 Lupi는 다른 질문에 대답 매우 곧 출시되었습니다 giorgialupi.net
benteh

이봐, 좋은 생각이야 방금 그녀에게 이메일을 보냈습니다.
Joshua Frank

2
이 답변에 대한 소설 상을받을 자격이 있습니다 n_n
Rafael

5

잠재 고객에게 데이터를 나타내는 데 필요한 키를 좁힐 수있는 몇 가지 추가 질문이 있다고 생각합니다. 나는 당신이 원하는 특정 직업으로 이력서를 줄이는 것과 매우 비슷하다고 생각합니다.

  1. 인포 그래픽을 만드는 이유는 무엇입니까?
  2. 잠재 고객이 데이터에 대해 알고 자하는 목표 또는 결과는 무엇입니까?
  3. 잠재 고객에 대해 무엇을 알고 있으며 데이터와 어떻게 관련되어 있습니까? (인구 통계 연령, 성별, 지리적 위치, 체중 등)
  4. 가장 중요하고 가장 중요한 데이터는 무엇이며 그 차이는 무엇입니까?
  5. 처음에 데이터를 생성하기위한 "순"목표를 달성하기 위해 데이터를 표시 할 매체 / 컨텍스트는 무엇입니까? 예를 들어, 데이터 또는 물리적 인 디지털 표현 일 것입니다 (대상 고객이 어린이 인 경우 항아리에 젤리 빈을 생각하십시오). 사무실 회의 나 상업 벤처에 해당됩니까?
  6. 데이터를 생성하려는 목표의 무결성을 유지하면서 데이터를 서로 다른 정보 그래프로 분할 할 수 있습니까?

당신의 데이터와 목표는 당신이 보여 주어야하고 보여주지 말아야 할 조건을 지시해야합니다. 예를 들어, 화요일 오후 1시에서 오후 3시 사이에 맥도날드에서 사람들이 주문한 것에 대한 그래프를 보여주는 것이 중요합니다. 원시 데이터가 있어도 시간 변수는 필요하지 않습니다. 그것은 우리의 목표가 아니 었습니다.

구체적으로 질문에 대답합니다. 나는 개인적으로 (주관적) 당신이 이것과 같은 기본 차트에서 three'ish / 4 변수 (크기, 모양, 색, 위치)를 사용하여 지나칠 때 독자 (me)가 지루하거나 잃어 버리고 지루하고 / 잃어버린 것 같지 않다고 생각 합니다 그래프가 작성된 이유. 그러나 그들은 완전히 재미 있고 청중을 참여시킬 수 있습니다. 예를 들어 this 와 반대되는 것이 있습니다. 나는 두 번째 예의 중요성을 할인하지 않습니다. 일반적인 데이터를 보여주는 사무실에서 회의를하는 경우 실제로 효과적인 정보 그래프이기 때문입니다. 이것은 데이터를 보여주는 매체와 맥락에 관한 질문으로 되돌아갑니다.

데이터에 변수를 표시하는 방법을 찾고 있다면 인포 그래픽을 조사하는 것이 좋습니다. 여기 효과적인 인포 그래픽을 만드는 방법에 대한 스매싱 매거진에서 좋은 시작 조각. 이 중 일부는 주관적 일 수 있습니다.


2

이것은 훌륭한 질문입니다. 진실로.

눈부신 생각의 선.

이것에 대해 약간의 토론이 있어야합니다. 그러나 나는 약간 다르게 말하고 싶습니다.

**

현대의 예시 기술 및 디자인과 얼마나 많은 속성을 상호 참조 할 수 있습니까?

**

대답은 제작의 세 가지 측면, 즉 디스플레이, 디자인 및 프리젠 테이션 모드에 있습니다.

디스플레이는 물리적 인 것입니다. 크기, 해상도 및 색 공간 제한이 있습니다.

디자인은 무제한이지만이 질문의 흥미로운 측면입니다. 현대의 예시 기술과 디자인과 창의성에 대한 이해를 최대한 활용하여 가장 잘 보여줄 수있는 방법.

프리젠 테이션 모드는 정적, 동적 또는 대화식입니다. 각각 고유의 장단점이 있으며 디스플레이의 매체, 유형 및 크기에 따라 합성됩니다.

그리고 Javi가 올바르게 지적했지만, 아마도 충분히 멀지 않을 것입니다 ... 이것은 모두 주제입니다!-그것은 관객을 고려하여 방정식을 고려한 것입니다. 아님

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.