플롯을 설계하고 생성하기위한 필수 규칙은 무엇입니까?


19

배경:

이전에 Cross Validated에서 다음에 대한 질문이있었습니다.

@david이 질문 에 대한 의견 에서 커뮤니티가 투표 할 수있는 답변 당 하나의 시각화 규칙 이있는 커뮤니티 위키 질문 이 있어야한다고 제안했습니다 .

질문

데이터의 그래픽 표현을 디자인하고 생성하는 데 필수적인 규칙은 무엇입니까?

규칙

  • 답변 당 하나의 규칙
  • 이상적으로 왜 그것이 좋은 생각이라고 생각하는지에 대한 간단한 설명을 포함 시키십시오
  • 좋은 연습과 나쁜 연습의 예 (코드와 이미지)가있는 답변이 선호됩니다.

답변:


13

양식 위의 물질 : 그래프 패키지에서 반드시 허용하는 것이 아니라 플롯에 표시 할 항목을 표시 할 적절한 플롯, 스타일, 색상 또는 기타 그래픽 매개 변수를 선택하십시오.


8
(+1) 나는 종종 그래프 디자인 소프트웨어에 의해 생성 된 최소 저항 경로에 의해 설계 결정이 유도 될 가능성을 줄이기 위해 종이에 그래프를 먼저 스케치하는 것을 선호합니다.
Jeromy Anglim

13

3 차원 색상에 익숙하면 도움이 될 수 있습니다. 여러 색상을 사용하는 경우 색상이 아닌 여러 치수에서 이상적으로 달라야합니다.

값. 흑백에서도 그래프를 읽을 수 있어야합니다. 이 간단한 규칙은 색맹, 저품질 프린터 및 열악한 조명 조건을 고려해야합니다. 다른 색조를 사용하더라도 값이 충분히 다른지 확인하십시오. 특히, 플롯은 밝은 배경 (또는 그 반대)에서는 어둡지 만 회색 값에서는 회색이 아니어야합니다. 최악의 예는 빨간색 배경의 파란색 플롯입니다. 둘 다 중간 값입니다. 즉, 흑백으로 변환 한 후 매우 유사한 회색을 나타냅니다.

포화. 채도는 조정과 함께 사용해야합니다. 순수한 빨간색 선은 괜찮을 수 있지만, 더 두껍고 덜 포화 된 빨간색 선은 더 읽기 쉽습니다 (두께가 증가하면 색상을 구별하고 채도를 줄일 수 있습니다). 반면에, 순수한 적색 영역은보기 힘들다. 브루 색상 팔레트 (지도를 위해 설계는 없습니다 라인 플롯) 저 채도 색상 선택의 예를 제공합니다. 최악의 예는 다시 포화 배경 (빨간색은 파란색, 파란색은 빨간색)입니다.

색조. @gung이 언급했듯이 빨강 / 녹색 (신호등) 조합은 피하십시오. 생각보다 많은 색맹 사람들이 있습니다. 특히 색조가 적을수록 좋습니다. 예를 들어 "diverging"값 (양수 또는 음수 일 수있는 수량)을 플로팅하려면 두 가지 색조 (양수 및 음수 값) 만 사용하므로 독자가 높은 것과 낮은 것을 즉시 구분할 수 있습니다. 불연속 그라디언트를 사용하면 훨씬 더 읽기 쉬운 플롯을 얻을 수 있습니다. 색상 사이의 경계가 보이고 윤곽 플롯을 형성합니다.

S. Few의 실제 색상 차트 사용 규칙 을 읽 거나 미술 또는 디자인 학생들을위한 "컬러 이론"에 관한 자료를 참조하십시오.


+1, 여기 좋은 정보입니다. 가치에 대한 요점과 흑백으로 변환 한 후 색상이 렌더링되는 방식이 특히 좋습니다. 몇 종이에 대한 링크도 도움이됩니다. 한 가지 참고 사항 : 다른 답변을 "위"로 언급하지 않는 것이 좋습니다. 대신 @ so-and-so를 사용하십시오. 답변은 몇 표를 얻었는지에 따라 움직입니다.
gung-Monica Monica 복원

11

필요한 정보를 그림 자체 내에 배치하십시오. 예를 들어 다양한 기호 나 색상의 의미를 식별하기 위해 독자가 캡션을 참조하도록 요구하지 마십시오. 캡션에 그림 자체에 들어갈 수없는 정보 (또는 보충 정보)를 배치하십시오. 아이디어는 그래프 뷰어가 관련 정보를 추출하는 데 필요한 노력을 최소화하는 것입니다. 최고 : 그래프는 자명하고 다음 최고입니다. 필요한 보충 정보는 캡션에서 빠르게 수집 할 수 있습니다. 최악의 경우 : 뷰어는 전체 결과 섹션에서는 무슨 일이 일어나고 있는지 파악하기 위해 중요한 세부 사항을 검색합니다.


1
하나, 우리는 더이 아이디어를 확장 할 수 있습니다 : 우리는 캡션을 읽을 필요없이에 무슨 일이 같은 사람들이 (가능한 한) 그래프와 노하우를 볼 수 있는지 확인하려면, 또한 그들에 대한 추가 정보를 필요로 할 때 사람들이 자막을 읽을 수 있고 한 가지 중요한 세부 사항을 검색하는 논문을 읽지 않아도 필요한 것을 알 수 있도록 자막에 포함시켜야합니다.
gung-모니 티 복원

1
@gung이 CW이므로 의견을 반영하여 답변을 수정하십시오.
David LeBauer

10

음모를 가능한 간단하게 만드십시오. Tufte의 말에서 '데이터 잉크 비율을 최소화하십시오'.

예를 들어, 피하십시오 :

  • 필요한 것보다 더 많은 색상 또는 모양
  • 필요한 것보다 더 많은 눈금
  • 2 차원 플롯에 대한 3 차원 효과.
  • 개체에 직접 레이블을 지정할 수있는 경우 범례 사용

나는 여기 Tufte에 동의하지 않습니다. 첫째, 그의 원래 책 에서이 규칙에 대한 동기 부여의 큰 부분은 불필요한 불필요한 선을 그리는 데 얼마나 많은 시간을 소비해야 하는가입니다. 그러나 이것은 오늘날과 관련이 없습니다. 둘째, 실제 아이디어는 그래픽의 정보 성을 극대화하기 위해 클리블랜드의 규칙에 의해 더 잘 포착됩니다. 때때로 음모가 더 많은 잉크를 사용하면 정보가 더 유익해질 수 있지만 두 규칙 모두 Tufte를 불쾌하게하는 차트 병법을 위반합니다.
gung-모니 티 복원

@ gung은 Tufte의 동기 부여로 필요한 노력 / 시간이 어디에 있었습니까? 나는이 부분을 기억하지 못합니다 (그러나 텍스트도 편리하지 않습니다).
David LeBauer

1
나는 그것을 가지고 있지 않지만 그의 첫 번째 책 Visual Display 에서 그래프를 그리기 위해 눈금자를 내려 놓은 횟수에 대해 이야기 한 것을 기억합니다. 어쩌면 "big"은 과장된 표현 일지 모르지만 나는 이것을 읽고 '지금 누가 신경 쓰고 있는가?' 에서 요소 , 클리블랜드 터프의 규칙이 잘못된 것을 설득력 인수를합니다. 그는 요점은 정보 전송을 극대화하는 것이라고 주장하며이 원칙은 Tufte가 싫어하는 것을 제거하지만 여분의 비 데이터 잉크가 그래프를 더 유익하게 만드는 경우를 보여줍니다.
복직 모니카

구체적인 제안 중 일부에 동의하지 않아야합니다 (예 : 3D 없음, 차트 정크 없음). 그래픽의 지침으로 Tufte의 규칙에 문제가 있습니다.
gung-모니 티 복원

@ gung 나는 휴리스틱 도구와 같은 토론을 해석했다. 독자가 디자이너의 작업을 줄이는 방법이 아니라 접근 방식을 쉽게 이해할 수있는 방법이었다.
David LeBauer

9

편집 할 시간을 내십시오. 좋은 그래프를 만들려면 시간이 걸리고 여러 번의 시도가 (적어도 나에게는) 필요합니다.


6

빨강과 초록에 반대하지 마십시오. 색상은 도움이 될 수 있지만 색상을 사용할 때는 항상 소수의 사람들이 적록 색맹임을 명심하십시오. 나는 한때 누군가에게 데이터를 보여 주었고, 그는 내 그래프에서 무슨 일이 일어나고 있는지 알 수 없었습니다. 그것은 낭비 였고 꽤 어리석은 느낌이었습니다. 다른 형태의 색맹은 매우 드물지만 적 녹색은 일반적입니다. 이 페이지 에는 좋은 정보가 많이 있습니다. 다음은 몇 가지 팁입니다.

  • 두 가지 색상 만 필요한 경우 파란색과 노란색을 사용하고 빨간색과 녹색을 사용하지 마십시오.
  • 그라디언트가 필요한 경우 채도와 명도를 동시에 변경하면서 파란색에서 노란색으로 이동하십시오. 무지개를 사용하지 마십시오.
  • 두 개 이상의 요소를 인코딩해야하는 경우 (예 : 두 개 이상의 그룹 또는 여러 줄의 산점도의 점) 다른 플로팅 기호 / 선 스타일로 색상을 백업합니다. 예를 들어, 고유 한 플로팅 기호 : o + <sw 또는 선 : 실선, 점선, 파선, 도트 파선 등 (선에 플로팅 기호를 추가하거나 선 두께를 변경할 수도 있음).

이것은 실제로 내가 종종 궁금했던 것입니다. 사용하기 가장 좋은 색상 그라디언트는 무엇입니까?
steffen

4

누적 막대 그래프를 사용하지 마십시오. 관련 메모에서 리 커트 척도 항목이있는 경우 각 항목에 대한 모든 반응의 비율을 표시 할 필요가 없습니다. 그 그래프는 내 눈을 피가 난다.

파이 차트를 사용하지 마십시오.

테이블에 던져서 그래프에 포함 된 데이터를 복제하지 마십시오.

그래프 제목 등에 Arial과 같은 sans serif 글꼴을 사용하십시오. 이러한 글꼴은 그런 식으로 사용되도록 설계 되었기 때문입니다.

책에 대한 참조가 없으면 디자인에 대한 게시물이 없습니다. 엄청나게 통계적 규칙이 마음에 듭니다 . 9 장은 여기서 논의와 관련된 비트이며, 누적 막대 그래프와 파이 차트를 싫어하는 이유를 물을 때 내가 지적하는 비트입니다. :)

고백 : 소규모 NGO 고객을위한 첫 번째 학생 컨설팅 역할 중 하나에서 컬러 막대로 인쇄 된 막대 그래프가 많이 포함 된 보고서를 제공했습니다 (1990 년대 중반). 나는 그 강아지들에게 노랑, 자주색, 빨간색을 얻을 수 있다고 생각합니다.


3

축을 엉망으로 만들지 마십시오. 그래프의 기울기가 더 인상적으로 보이기 때문에 처음 100 단위를 자르지 마십시오. 이미지가 고착되고 사람들은 실제로 측정 된 것보다 훨씬 큰 효과를 기억합니다.


2
겉보기 경사를 변경하기 위해 데이터를 자르는 것은 사기입니다. OTOH, 축이 항상 0을 포함 해야하는지 여부와 (종종 덜 관련성이있는) 사용되는 종횡비를 포함 해야하는지에 대한 실제 의문이 있습니다. 클리블랜드는 데이터 창 내에서 데이터를 최대화하고 '뱅크'경사를 45 도로 기울이면 그래프가 더 유익하다는 강력한 사례를 제시합니다. 클리블랜드는 전문 청중이 유능하고 글을 읽고 이해해야한다고 주장하지만, 순진한 청중은 이러한 기능을 명시 적으로 지적하고 설명하거나 사용하지 않을 것입니다.
gung-복직 모니카

전문 청중조차도 몇 개월 후 그래프의 가파른 선만 기억할 것이며 요격과 그 밖의 모든 것을 잊었을 것입니다. 극단적 인 값에 올바르게 레이블을 지정하여 (평평한) 그래프의 모든 데이터를 가질 수 있으며 실제로 실제로 주문 시간을 변경 한 정보가 없습니다.
xmjx

2
동의하지 않습니다. 모든 축이 0에서 시작한다고 주장하는 것이 현명한 규칙이라고 생각하지 않습니다. 그래픽은 데이터의 변화와 구조를 보여 주어야합니다. 중요한 것이 2 백만의 값 주위에서 100,000의 변동 (그리고 아마도 두 그룹간에 어떻게 다른지) 인 경우 그래픽은 "2 백만이 큰 숫자가 아니라" ".
피터 엘리스

기본적으로 모든 디자인 규칙과 마찬가지로, 플로팅 된 변형의 실제적인 중요성과 청중이 해석하는 방식을 실제로 이해하면 이것이 깨질 수있는 것이라고 생각합니다. 그러나이 규칙은 너무 자주 그리고 심각하게 위반되어 "모든 음모에는 0이 포함되어야합니다!"라고 큰 소리로 선언하는 것이 비교적 안전하다고 생각합니다. 실제로 최대 스프레드가 약 5 % 인 지난 20 년 동안
Matt Parker

5 %가 무의미한 것은 아니며 대부분의 도표는 변동을 일으킨 정책의 결과에 대한 논증과 관련이 있습니다. 그러나 경제적으로 큰 영향을 미치는 대규모 정책이 실제로 주택 소유에 미치는 영향이 적다는 점을 강조한다면 이러한 주장은 더욱 강력해질 것이라고 생각합니다.
Matt Parker
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.