편집 III : 다 변수 정량적 데이터 시각화의 놀라운 예를 발견하고 추가해야했습니다. "Edit III (Nobel laureates)"제목 아래에 있습니다.
편집 II : 약간의 오해가 있었으며, 의도 된 데이터 사용을 해석하는 방법을 명확히하기 위해 편집했습니다. 두 개의 이미지를 교체 하고 "그것과 감자 튀김을 원하십니까?" 섹션을 추가했습니다.
그래픽은 데이터를 나타냅니다 .
에드워드 툭테 :
혼란과 혼란은 정보의 속성이 아닌 디자인의 실패입니다. 클러 터는 컨텐츠 축소가 아닌 설계 솔루션을 요구합니다. 의미와 추론이 끊임없이 문맥 적이기 때문에 세부 사항이 강렬할수록 명확성과 이해도가 높아집니다. 적은 구멍입니다.
왜 데이터를 시각화합니까?
- 사고를위한 도구
- 강렬한 시청 결과를 보여주기 위해
- 문제를 이해하고 결정하기
- 비교 표시, 인과 관계 표시
- 믿을만한 이유를 제시하십시오
어떻게?
- 데이터를 보여
- 시청자에게 방법론, 그래픽 디자인, 그래픽 제작 기술 또는 다른 것에 대한 것이 아니라 물질에 대해 생각하도록 유도
- 데이터가 말한 것을 왜곡하지 마십시오
- 작은 공간에 많은 수를 제시하다
- 대용량 데이터 세트를 일관되게 만들다
- 눈이 다른 데이터를 비교하도록 장려
- 광범위한 개요에서 미세 구조에 이르기까지 여러 수준의 데이터를 공개합니다.
- 설명, 탐사, 표 또는 장식과 같이 합리적으로 명확한 목적을 수행합니다.
- 데이터 세트의 통계 및 언어 설명과 밀접하게 통합됩니다.
몇 가지 정의 :
데이터:
일반적으로 "데이터베이스에서 정렬 된 항목"으로 생각됩니다. 이것은 물론 숫자, 이미지, 사운드, 비디오 등이 될 수 있습니다. 데이터는 종종 양적으로 수집 가능한 것입니다. 가장 생생한 형태로 소화하기가 어렵습니다. 숫자의 벽. 당신은 알고있다; 매트릭스 . 일반적으로 말하자면, 우리가 가지고 있지 않은 것들이 가장 유익한 것들이더라도, 우리가 가지고 있지 않은 모든 것들에 대해 0으로 구성된 방대한 데이터베이스 는 없습니다 . 그래서 우리는 우리가 무엇을 시각화 할 필요가, 우리가없는 것을 볼 수 않습니다 있습니다.
정보:
데이터에서 추출 할 수있는 것 입니다. 어떻게 든 데이터를 표시함으로써 정보 를 수집 할 수 있습니다 . 내가 자주 사용하는 예 중 하나는 내가 세계의 국가 목록을 제공하고 두 국가가 누락되었다고 말하면 해당 목록을 기반으로 찾을 가능성이 거의 없다는 것입니다. 그러나 내가지도에있는 모든 국가를 색칠하여 이것을 표시하면 중앙 아프리카 공화국과 뉴 칼레도니아가 생략되었음을 즉시 알 수 있습니다. 이것은 "소음 줄이기"이며 가장 효과적인 방법으로 이야기를 전합니다.
인포 그래픽 및 데이터 시각화 :
나는 당신의 예제 인포 그래픽을 부르기를 주저합니다. 나는 이것이 종종 데이터 시각화, 정보 디자인 또는 정보 아키텍처와 동의어로 보인다는 것을 알고 있지만 동의하지 않습니다. 인포 그래픽은 저에게 데이터를 읽는 방법에 대한 여러 가지 편견을 포함 할 수 있는 일련의 그래프, 다이어그램 및 그림 입니다. 제작자의 "관심"에없는 데이터를 건너 뛰는 것은 객관적이지 않으며, 더 쉽게 건너 뛸 수 있습니다. 누군가 미리 정의한 결론을 내립니다. 그들은 엔터테인먼트 가치가 있으며 종종 데이터에서 일부 초점을 벗어난 일러스트레이션을 압도적으로 사용합니다. 이것은 괜찮지 만 조금 차별화해야한다고 생각합니다.
예
빅 데이터:
빅 데이터는 복잡한 데이터와 동일하지 않습니다. 이 LinkedIn 맵과 같이 많은 데이터가 동일 할 수 있습니다. 핵심 데이터는 동일하지만 태그 가있는 필터 가 있습니다 . 지리와 직업 / 관심사 / 관계로 사람들을 정의하는 일종의 태그라는 두 가지 변수가 있습니다. 미친 양의 데이터; 하지만 두 변수 만 있습니다.
다 변수 :
다음은 다 변수 데이터 시각화의 예입니다. 나폴레옹의 1812 년 러시아 운동 군의 인원 수, 운동량 및 귀환 경로에서 발생한 온도를 보여주는 Charles Minard의 1869 차트입니다.
여기 큰 버전이 있습니다.
코드를 해독하는 데 약간의 시간이 걸리지 만 그렇게하면 훌륭합니다. 다루는 변수는 다음과 같습니다.
- 군대 규모 (생명 / 사망자 수)
- 지리적 위치
- 방향 (동서)
- 온도
- 시간 (날짜)
- 인과 관계 (전투와 추위로 사망)
그것은 단순한 2 색지도에서 놀라운 양의 정보입니다. 지리적 부분은 다른 변수에 대한 공간을 제공하기 위해 양식화되었지만 우리는 그것을 얻는 데 아무런 문제가 없습니다.
여기 더 까다로운 것이 있습니다. 기본적인 진화 시각화, 클라도 그램, 계통 발생 및 생물 지리학 원리에 익숙하다면이 방법을 훨씬 쉽게 읽을 수 있습니다. 이것은 익숙한 사람들을 위해 만들어 졌으므로 전문적이고 과학적인 차트입니다. 그 내용은 다음과 같습니다. 독 개구리의 계통 학적 이미지는 남아메리카의 계보입니다. 왼쪽의지도는 시간이 지남에 따라 변화하는 주요 생물 지리적 영역을 보여주고 오른쪽의 이미지는 생물 지리적 기원과 관련하여 개구리 혈통을 보여줍니다. (산토스 JC, Coloma LA, Summers K, Caldwell JP, Ree R 등 [CC-BY-SA-2.5 (www.creativecommons.org/licenses/by-sa/2.5)], Wikimedia Commons를 통해) "코드를 크래킹"하면 매우 놀랍도록 유익합니다.
작은 배수, 스파크 라인 :
나는 이것을 충분히 강조 할 수 없다 : 반복되는 정보의 가치를 절대 과소 평가하거나 그것을 별도의 동일한 시각화로 나누지 마십시오. 한 그래프를 다른 그래프와 비교하는 것이 합리적으로 쉬운 한, 이것은 완벽합니다. 우리는 패턴 찾기 기계입니다. 이것을 종종 작은 배수라고합니다. 이러한 이미지를 매우 빠르게 분석하는 데는 거의 문제가 없으며 10 개의 작은 이미지가 더 잘 작동 할 때 모든 것을 하나의 큰 그래프로 만드는 것은 무의미합니다.
다른 것:
다르지만 반복되는 그래픽을 사용하는 것 :
스파크 라인 은 Edward Tufte가 만들어 낸 용어이며
, 완벽하게 작동하며 완벽하게 사용자 정의 가능한 Javascript 라이브러리 로 개발되었습니다 . 기본적으로 "외부"개체가 아닌 텍스트의 일부로 텍스트에 삽입 할 수있는 작은 차트입니다. 기본값은 다음과 같습니다.
편집 III (노벨상 수상자)
방금 찾은이 데이터 시각화를 추가해야했는데 너무 좋았습니다. 노벨상 수상자입니다. 어느 대학, 어떤 교수, 과목, 연도, 나이, 고향, 어느 정도 공유, 학위 수준. 실제로 아름다운 증거. 이들은 모두 정량화 가능한 데이터입니다. 여기 더 있습니다.
귀하의 데이터
@Javi 포즈의 모든 질문은 매우 중요합니다.
당신이하려고하는 것은 생각을위한 시각적 도구를 만드는 것입니다. 그러기 위해서는 최상의 신호 대 잡음비를 추출해야합니다. 어려움을 겪고있는 것은 다른 변수를 가진 데이터 를 정보 와 연관시키는 방법 입니다. 여기에 질문이 있습니다 : 대략 옳 아야하는 것과 정확히 옳 아야하는 것은 무엇입니까? 목표는 무엇입니까?
너무 많은 편견없이 데이터를 표시하려고한다고 가정하겠습니다. 상관 관계가있는 경우 독자가 상관 관계를 직접 찾아보기를 원합니다. 당신의 목표는 사람들에게 햄버거가 그들에게 나쁘거나 여성이 남성보다 적은 햄버거를 먹는다는 것을 알리는 것이 아니라 데이터에 포함 된 것이면 (그 세 사람이 가족 이었다면 상상할 수 있도록) "볼"수 있도록하는 것입니다. 햄버거 먹기 그래프 전체에 대한 우리의 견해를 바꾸십시오).
데이터 세트가 너무 작아서 테이블에 모두 넣을 수 있습니다. 물론 이것은 일반적인 아이디어에 관한 것입니다.
약간의 세부 사항 : 시간 (나이)은 왼쪽에서 오른쪽으로 (타임 라인) 수평으로 보이는 경향이 있습니다. 위 아래로 무언가에 무게를두기 때문에 x-y를 전환하는 것이 좋습니다.
1. 고유하고 고정 된 개체는 무엇입니까?
2. (eh ..) 변수 변수는 무엇입니까?
- 중량 (kg)
- 연령 (년)
- 버거 수 (정수)
- 버거 유형 (정수)
참고 : 데이터는 전적으로 단위로 구성됩니다. 별도의 정신 척도로 각각 계산 가능하고 정량화 할 수 있습니다. 킬로, 나이, 체중 및 숫자. 데이터베이스에서 말하면, 그들의 이름이 열쇠입니다. 시공간 시각화를 시작하면 실제로 두통이됩니다. 출생지, 현재 집 등을 추가해야한다고 상상해보십시오.
여기서 상관 관계 가있는 유일한 것은 햄버거의 수이며 콤보입니다. 다른 모든 변수는 독립적이며 하나만 고정됩니다 (이름). 어느 시점에서 대규모 데이터 세트를 사용하면 이름조차도 흥미롭지 않고 인구 통계, 연령, 성별 등으로 대체됩니다.
작은 데이터 세트를 사용하면 다음과 같이 하나의 그래프로 모든 것을 얻을 수 있습니다.
또는 축과 이름-버블 내용을 변경할 수 있습니다.
개인 참고 사항 : x와 y에 인간의 "물리적"속성이 포함되어 있기 때문에 이것이 둘 중 더 낫다고 생각합니다. 거품의 변수는 버거의 수입니다.
그래프 외에도 파이 차트를 추가하거나 파이 차트 만 가질 수도 있습니다. 개인적으로 나는 작은 배수에 대해 언급했듯이 둘 다 가질 것입니다.
그걸로 감자 튀김을 원하십니까?
내 가정은 햄버거와 식사의 비율을 알고 싶었다는 것입니다. 모든 식사에는 햄버거가 포함되어 있습니다. 모든 식사가 콤보 인 것은 아닙니다.
- 사람이 때때로 combomeals를 먹는지 알고 싶습니까?
- 아니면 우리는 얼마나 많은 버거 식사가 combomeals 인지 알고 싶습니까?
1이면 이름 / 키 / ID에 부울을 적용한 것입니다.
제인은 때때로 combomeals를 먹는가? 허위 사실.
2 인 경우 각 식사에 부울을 적용 할 수 있습니다 .
1 치즈 버거, combomeal = true
1 치즈 버거, combomeal = true
치즈 버거 1 개, combomeal = false
치즈 버거 1 개, combomeal = false
치즈 버거 1 개, combomeal = false
치즈 버거 1 개, combomeal = false
치즈 버거 1 개, combomeal = false
1 개의 버거 버거, combomeal = true
1 개의 버거 버거, combomeal = true
1 개의 버거 버거, combomeal = false
매우 지루하므로 다음과 같이 분류 할 수 있습니다.
제인은 햄버거 10 개를 먹습니다. 이 중 3 개는 콤보입니다.
combomeals 중 하나는 비프 버거 메뉴입니다.
combomes 중 두 가지는 치즈 버거 메뉴입니다.
나머지는 싱글 버거입니다. 치즈 5 개, 쇠고기 2 개
이 원형 차트는 그것을 시각화하려는 시도였습니다. 이 버전에서는 파이 조각을 더 선명하게 유지했습니다. 이것에 대한 것은 큰 데이터 세트와 %를 적용하기 시작하는 데 아무런 도약이 없다는 것입니다.
그러나 가장 좋은 방법은 다시 생각하는 것입니다.
그것을 보는 또 다른 방법은 정말로 간단하게하는 것입니다. 여기에서 연령대, 체중 그룹 및 "보유하지 않은" 모든 데이터 를 알려주 는 것이 더 쉽습니다 . 당신이 가지고있는 데이터는 공간과 관련이 없으며 단위 (kg, 년, 숫자 + 키 / ID / 이름)입니다.
(편집 : 내 얼굴에 계란 : "모든 식사는 콤보가 아니라 모든 식사는 햄버거입니다"에 관해서는이 이미지를보다 정확한 이미지로 바꿨습니다.
더 많은 사람들과 함께 확장하는 것은 매우 쉽습니다.
또는 10 세, 20 세 및 30 세 연령대를 비교하면 통계 시각화를 읽기 매우 간단하게 만들 수 있습니다.
.. 그리고 가능한 한 명확해야합니다. 다음은 이러한 사고 방식의 예입니다. 이 차트는 타이타닉 생존자, 승무원, 계급, 남성, 여성의 비율을 보여줍니다.
다른 솔루션이 많이있을 것입니다. 이것은 단지 몇 가지 생각입니다.
나는 계속해서 갈 수 있었지만 이제는 나 자신과 다른 모든 사람들을 지쳤습니다.
가지고 놀 도구 :
지피
Gapminder Hans Rosling 의이 놀라운 TED 프레젠테이션을 보십시오.
구글 차트
솜 비스
라파엘
MIT 전시회 (이전 명칭 Similie)
d3
하이 차트
더 읽을 거리 :
PJ 오 노리; 열심히 방어
Edward Tufte : 아름다운 증거
Edward Tufte : 구상 정보
Edward Tufte : 정량적 정보의 시각적 표시
시각적 설명 : 이미지 및 수량, 증거 및 내러티브
Male, Alan., 2007 이론적이고 상황적인 관점의 그림 Lausanne, Switzerland; 뉴욕, 뉴욕 : AVA 아카데미아
Isles, C. & Roberts, R., 1997. 예술, 과학 및 일상의 가시 광선, 사진 및 분류, 현대 미술관 옥스포드.
Card, SK, Mackinlay, J. & Shneiderman, B. eds., 1999. 정보 시각화의 독해 : 비전을 사용하여 1 차 사고, Morgan Kaufmann.
Grafton, A. & Rosenberg, D., 2010. 시간의지도 제작 : 타임 라인의 역사, 프린스턴 건축 출판사.
Lima, M., 2011. 시각적 복잡성 : 정보의 패턴 매핑, Princeton Architectural Press.
Bounford, T., 2000. 디지털 다이어그램 : 통계 정보를 효과적으로 설계하고 제시하는 방법 0 ed., Watson-Guptill.
Steele, J. & Iliinsky, N. eds., 2010. 아름다운 시각화 : 전문가의 눈을 통해 데이터를 보는 첫 번째 에디션, O'Reilly Media.
Gleick, J., 2011. 정보 : 역사, 이론, 홍수, 판테온