이해하는 데 도움이되지 않는 방식으로 그래프에 공백을 사용하지 마십시오. 데이터를 표시하려면 공간이 필요합니다!
통계적 판단뿐만 아니라 과학 (엔지니어링, 의료, 사회, 비즈니스 등) 판단을 사용하십시오. (고객 또는 고객이 아닌 경우, 해당 분야의 누군가와 대화하여 흥미 롭거나 중요한 것이 무엇인지, 바람직하게는 분석을 의뢰하는 사람들과상의하십시오.)
0과의 비교가 문제의 중심이거나 관심이있는 경우 축 에 0을 표시하십시오 .y
이것들은 세 가지 간단한 규칙입니다. (때로는 그들 사이의 긴장을 배제하는 것은 없습니다.)
다음은 간단한 예이지만 세 가지 점이 모두 발생합니다. 섭씨 또는 화씨 또는 켈빈 환자의 체온을 측정하십시오. 어떤 의미에서 제로 온도 표시를 주장하는 것이 도움이되거나 논리적인가? 중요하거나 의학적으로나 생리적으로 중요한 정보도 그렇지 않으면 모호해질 것입니다.
다음은 프레젠테이션의 실제 이야기입니다. 한 연구원은 인도의 여러 주와 노조 영토의 성별 비율에 대한 데이터를 보여주었습니다. 그래픽은 모든 막대가 0에서 시작하는 막대 차트입니다. 상당한 변화에도 불구하고 모든 막대는 같은 길이에 가깝습니다. 맞습니다. 그러나 흥미로운 이야기는 차이점에도 불구하고 영역이 비슷하다는 것이 아니라 유사점에도 불구하고 영역이 다르다는 것입니다. 나는 남성과 여성 (1 명 또는 100 명의 여성 / 100 명의 남성) 사이의 패리티가 훨씬 더 자연스러운 기준 수준이라고 제안했다. (저는 국가 평균과 같은 전체적인 수준을 참고로 사용하기도합니다.)이 작은 이야기를들은 일부 통계적 사람들조차도 때때로 "아니오; 바는 항상 0에서 시작해야합니다"라고 대답했습니다. 나에게 그것은 그러한 경우에 관련없는 교리보다 낫지 않습니다.
막대 그래프를 언급하면 사용 된 그래프의 종류도 중요하다는 점이 지적됩니다. 체온의 경우 축 범위 35 ~ 40 C가 편의를 위해 모든 데이터를 포함하여 선택되어 축이 35에서 "시작"된다고 가정합니다. 35에서 시작하는 막대는 모두 데이터. 그러나 여기서 문제는 잘못 선택된 축 범위가 아닌 그래프 요소의 부적절한 선택입니다.y∘y
일반적인 종류의 줄거리, 특히 일부 생물학 및 의료 과학에서 보이는 것처럼 0에서 시작하는 두꺼운 막대와 얇은 막대에 의한 불확실성을 나타내는 표준 오차 또는 표준 편차 기반 간격으로 평균 또는 기타 요약을 보여줍니다. 이러한 기폭 장치 또는 다이너마이트 플롯은 승인하지 않은 사람들이 불렀던 것처럼 0이 항상 표시되어야한다는 말 때문에 부분적으로 인기가있을 수 있습니다. 순 효과는 종종 관심이나 유용성이 부족한 0과의 비교를 강조하는 것입니다.
일부 사람들은 0을 표시하고 스케일 중단을 추가하여 스케일이 중단되었음을 표시하려고합니다. 패션은 변하고 기술은 변합니다. 수십 년 전, 연구원들이 그래프를 직접 그리거나 기술자에게 과제를 위임했을 때,이를 직접 수행하도록 요청하는 것이 더 쉬웠습니다. 이제 그래픽 프로그램은 종종 스케일 나누기를 지원하지 않으므로 손실이 없다고 생각합니다. 그래도 그래픽 영역의 중간 부분을 낭비 할 수있는 까다로운 추가 작업입니다.
아무도 축 에 대해 동일한 규칙을 고집하지 않습니다 . 왜 안돼? 지난 세기 정도의 기후 또는 경제 변동을 보이면 규모가 BC / CE 경계 또는 다른 원산지에서 시작해야한다는 것이 이상 할 것입니다.x
언급 된 세 가지 외에 자연스럽게 적용되는 규칙이 0입니다.
- 당신이 무엇을 하든지, 매우 명확합니다. 축에 일관되고 유익한 레이블을 지정하십시오. 그런 다음주의 깊게 읽는 독자는 자신이 한 일을 볼 것임을 믿습니다.
따라서이 시점에서 나는 Edward Tufte에 강력하게 동의하고 Darrell Huff에 동의하지 않습니다.
2016 년 5 월 9 일 수정 :
모든 차트에 항상 0 기준선을 포함 시키려고하는 대신 논리적이고 의미있는 기준선을 대신 사용하십시오
카이로, A. 2016.
진실 된 예술 : 데이터, 차트 및 커뮤니케이션지도.
샌프란시스코, 캘리포니아 : New Riders, p.136.