어떤 특성이 "전문적 품질"을 낳습니까?


35

나는 사람들이 ORIGIN에 의해 ​​생성 된 음모가 세련되고 "전문적"인 경향이 있지만 Mathematica에 의해 생성 된 음모는 그렇지 않다고 말합니다. 그러나 대부분의 플롯 작성 프로그램은 구성이 가능하며 눈금 위치 및 레이블 지정, 글꼴 및 색상 선택, 레이블 정렬 등과 ​​같은 항목에 대한 올바른 설정을 사용하여 Mathematica로 그림을 만들 수 있어야합니다. / matplotlib / Gnuplot / etc. ORIGIN에서 온 것만 큼 좋아 보입니다. 그러나이 맥락에서 인물이 "전문적"이라는 것은 무엇을 의미합니까?

다시 말해서, 나의 목표가 과학 논문에 포함시킬 수있는 최상의 그림을 만드는 것이라면, 그 목표를 위해 일반적으로 어떤 디자인 선택이 권장됩니까? 분명히 막대 그래프 대 산점도, 선형 대 로그 스케일과 같은 적절한 종류 의 플롯을 선택해야하지만, 우리가 사용하는 플로팅 프로그램에 관계없이 항상 우리가 생각하는 선택입니다. 나는 우리가 일반적으로 생각하지 않는 것들에 더 관심이 있습니다. 일반적으로 일부 플로팅 프로그램의 기본값에 따라 설정되지만 플롯의 모양을 개선하기 위해 변경 될 수 있습니다.


2
이것은 여기서 다루어지지 않을 수도 있습니다 ... 나는 수용 가능한 데이터 시각화 질문의 경계를 조사하기 위해 게시하고 있습니다 (cf meta.scicomp.stackexchange.com/questions/55/… )
David Z

5
과학 출판물로 만드는 많은 음모의 품질이 열악하다는 점을 고려할 때, 공동체의 정의를 개선해야 할 수도 있습니다!
David Ketcheson

2
@DavidZaslavsky는 - 나는 그것이로이 사실이 질문에 대한 가장 적합한 장소가 될 거라고 생각 입니다 계산 과학의 일부입니다 과학적 데이터의 프리젠 테이션, 특정가. 나는 종종 과학자들이 우리 소프트웨어에 의해 생성 된 그래프가 '발표 표준'이 아니며 수정되어야한다는 불만을 보았다. 주관적인 질문이 있더라도 항상 6 가지 지침을 따라야합니다 .
Mark Booth

물론 @Mark. 나는 기술적 인 질문이 아니라는 것을 가능한 한 객관적으로 만들려고 노력했습니다.
David Z

고마워 데이비드, 저의 의견은 우리가 그 당시에 짧은 답변을하려고했던 것에 대한 질문에 답하는 사람들을위한 것이 었습니다. 6 가지 지침은 매우 짧고, 의견에 대한 경험, 가정에 대한 맥락, 편견에 대한 공평성, 플립 판트에 대한 심각성, 사실 및 참고 자료 등으로 답변을 뒷받침하는 것을 선호합니다. 의문.
Mark Booth

답변:


14

"전문적인 품질"을 수치화하는 IMO는 저널 / 게시자 규칙에 의해 정의됩니다. 실제로 게시 위치에 따라 상대적인 "게시 품질"로 변환됩니다. 사용되는 플로팅 소프트웨어는 변하지 않는 일부 보편적 인 규칙이 두드러집니다.

1) 그림에는 정보 / 아이디어 / 인수를 전달하는 데 필요한 요소가 적어야합니다. 그림은 몇 초 안에 쉽게 읽고 이해해야합니다. 그림에서 무슨 일이 일어나고 있는지 이해하는 데 시간이 더 걸리면 정보가 너무 많을 수 있습니다. 너무 많은 방해가 되더라도 자신의 음모 / 데이터에 익숙하기 때문에 확인하기가 어려운 경우도 있습니다. (그림 뒤에있는 물리적 의미를 이해하는 데 오해하지 마십시오. 보통 꽤 오랜 시간이 걸립니다).

2) 색상을 사용해야하는 경우 색상환의 반대쪽에있는 사람을 제한하는 것이 가장 좋습니다. 예를 들어 파란색과 빨간색이 파란색과 녹색보다 낫습니다. 그림에는 음영이 많을 수 있지만 기본 색상을 거의 사용하지 않는 것이 가장 좋습니다. 나는 종종 사이에 흰색 전환과 함께 파란색 (낮은 값)과 빨간색 (높은 값)을 사용하고 싶습니다. 색맹 인 독자를 항상 염두에 두십시오.

3) 눈금 표시, 등고선 레이블 등은 모두 돋보기없이 쉽게 읽을 수 있어야합니다. 따라서 저널 본문과 비슷한 글꼴 크기입니다. 그림 너비가 3 및 6 인치 인 하드 카피를 인쇄하여 모든 내용을 읽을 수 있는지 확인할 수 있습니다 (이것은 과학 저널에서 일반적인 그림 크기입니다).

4) 마지막으로 그림의 모든 단일 요소가 목적을 가지고 있는지 확인하십시오. 유용한 정보를 전달하지 않는 것이 있으면 버리십시오. 그것은 그림의 가독성을 도울 것입니다.

눈금, 레이블 등 그림을 만드는 모든 작은 요소를 사용자 정의하는 데 익숙한 지점에서는 깨끗한 eps를 생성 할 수있는 도구를 사용하는 것이 중요하지 않습니다.


(1)에 대한 이론적 근거를 자세히 설명 할 수 있습니까? 몇 초가 오래 걸리지 않습니다. 사람들이 정말로, 정말로, 바쁘다는 실제적인 근거에서이 수치를 이해하는데 몇 초 이상이 걸리더라도 그들은 귀찮게하지 않을 것입니까?
Faheem Mitha

@FaheemMitha 아니요, 제가 정말로 의미하는 바는 수치를 명확하고 단순하게 유지하면 독자들에게 호의를 베풀고 있다는 것입니다. 확실한 기준으로 몇 초를 유지하지 마십시오. 이것은 내 자신의 수치를 평가하는 데 사용되는 방법입니다. 한 그림에 얼마나 많은 정보를 넣을 수 있는지에는 한계가 있습니다. 너무 많이 넣으면 독자가 이해하기 어려운 내용이 될 수 있습니다. 당신의 독자들은 당신의 작업에 관심이 있다면 매우 바쁜 수치를 읽는 것을 귀찮게 할 것입니다.
milancurcic

나는 그런 끔찍한 질문에 대한 대답을 받아들이는 것이 전적으로 의미가 없지만,이 대답은 내가 질문했을 때 염두에 둔 모호한 아이디어를 가장 잘 정리 한 것으로 보인다. 그래서 당신은 확인 표시를 얻습니다 :-)
David Z

18

내 작품에서 "게시물 품질"을 고려할 때 또는 다른 사람을 볼 때 고려중인 요소가 몇 가지 있습니다. 그들은:

  1. 고해상도, 바람직하게는 벡터 기반. 이것은 지금까지 상당히 분명해야하지만 놀랄 것입니다.
  2. 혼란이 부족합니다. 나는 당신의 모습에서 무슨 일이 일어나고 있는지 빨리 볼 수 있어야합니다. "높은 잉크 : 용지 비율"지침을 따르고이를 사용하여 전체 원고를 하나의 그림으로 작성하려고 시도하는 것보다 내가 싫어하는 것은 거의 없습니다.
  3. 잘 인쇄합니다. 이것은 실제로 저에게 가장 중요한 것입니다. 논문을 검토 할 때는 항상 테스트합니다. "그림이 인쇄됩니까?" 두 번 이상, 그레이 스케일로 인쇄 할 때 포인트가 완전히 난독 화되는 수치에 부딪 쳤습니다.
  4. 제작자가 그래픽 설정을 사용하는 방법을 알고 있다는 증거. 홀수 볼 축 선택, 올바른 장소의 눈금 표시 등이 없습니다.
  5. # 2와 결합하면 본질적으로 그래픽적인 "번창"이 부족합니다. 독자의 시간을 낭비하는 것 외에는 아무것도하지 않는 그림자, 불필요한 3D 등.

대부분은 프로그램별로가 아니라 정직하게 제작자마다 다릅니다. R에서 끔찍한 줄거리를 보았고 Excel에서 훌륭한 줄거리를 보았습니다.


벡터 그래픽이 실제로 바람직하다. 그러나 널리 사용되지 않는 그리기 프로그램이 있습니까?
Faheem Mitha

2
드로잉 프로그램? 내가 생각할 수있는 것은 아닙니다. 플롯을 생성하는 프로그램-통계 패키지 등? 그들 중 많은 사람들이 사용할 수 있거나 기본값으로 벡터가 아닌 출력 형식을 가지고 있습니다.
Fomite

14

우리가 데이터 수치에 대해 이야기하고 있다면 Edward Tufte의 질적 정보의 시각적 표시아름다운 증거로 이동하십시오 .

Tufte 씨는 물론 몇 가지 세부 사항을 다루지 만, 나에게 두드러지는 원리는 프레임과 장식에 잉크를 소비하는 것이 아니라 가능한 한 많은 양의 잉크를 사용하여 정보를 전달하는 것입니다.

마크 요청에 따라 수정 :

질적 정보의 시각적 표시 에서 몇 가지 주요 사항 은

  • 해야 할 말을 왜곡하거나 난독 화하지 않는 방식으로 데이터를 표시
  • 서로 다른 수준의 서로 다른 데이터를 비교할 수 있도록 디스플레이 정렬
  • 그래픽 측면을 통계 및 언어 설명과 통합
  • 목적에 맞지 않는 요소 (또는 다른 요소에 의해 중복되는 요소)를 제거하여 데이터 대 잉크 비율을 최대화하고 추가 정보를 전달하기 위해 존재하는 요소 (예 : 상자 그림의 변형 축)를 사용합니다.
  • 작은 배수를 사용하여 이러한 추가 차원을 비교할 수 있도록 더 높은 차원의 데이터 세트를 배열 할 수 있습니다.

아름다운 증거 는 그 범위에서 더 넓은 범위의 책입니다. 챕터 제목을 재현하겠습니다.

  • 매핑 된 사진 : 증거 및 설명 이미지
  • 스파크 라인 : 강렬하고 단순하며 단어 크기의 그래픽
  • 링크와 인과 화살표 : 실제 모호성
  • 단어, 숫자, 이미지-함께
  • 분석 설계의 기본 원리
  • 증거 발표의 부패 : 원인이없는 효과, 체리 따기, 손이 닿는 것, 차트 정크 및 분노의 결론
  • 인지 스타일의 PowerPoint : 내부에서 부패를 피칭
  • 조각 받침대 : 의미, 연습, 역설
  • 조경 조각품

Beautiful Evidence 에서 흥미로운 관찰 중 하나는 일반적으로 인쇄물에 고밀도 출력 장치 (요즘 300 DPI 프린터는 저밀도 장치 임)를 사용하지만 종종 스크린이나 라인 프린터에 대한 수치를 그려 큰 잠재력을 낭비한다는 것입니다. 정보 전달을 위해.


양적 정보의 시각적 표시의 13 페이지 는 "전문 그래픽"에 대한 요약 또는 "그래픽 우수성"이라는 제목으로 시작합니다.
Brian Diggs

@Brian Diggs-귀하 또는 dmckee가이 요점을 요점 요약으로 업데이트 할 수 있습니까? 우리 중 많은 사람들이 실제로 책을 사거나 구매할만큼 관심을 갖지 않고 요약을 알기에 충분히 관심이있을 수 있습니다.
Mark Booth

@ 마크 : 나는 다음 날에 그것을 얻을거야 ... 내 사본은 사무실에 있고 지금은 아니에요.
dmckee

8

제가 개인적으로 만들 수 있었던 최고의 수치는 TeX 패키지 PGF / TikZ 입니다. 어려운 과학 분야의 많은 사람들이 LaTex를 사용한다면 이미 알고있을 것입니다.

LaTex 그래픽 패키지의 리더이기도합니다. TeX StackExchange 사이트 의 질문에 대한 상당한 비율 은 PGF / TikZ에 관한 것입니다. 결과가 왜 그렇게 좋은지 잘 모르겠지만 LaTeX를 사용할 때 PGF / TikZ가 다른 패키지에 비해 한 가지 이점은 텍스트와 더 잘 통합된다는 것입니다. 우선, 그림의 글꼴은 텍스트의 글꼴과 동일합니다.


물론 실제로 그림을 만드는 것이 가장 좋아하는 방법입니다. ;-) 그러나 TikZ 플롯이 왜 좋은지에 관심이 있습니다.
David Z

1
@DavidZaslavsky : 나는 몰라. 천재가 될 때까지? :-)
Faheem Mitha

@DavidZaslavsky : 진지하게, 그 질문은 tex.sx에 관한 주제에 관한 것이므로 이미 해결되었을 것입니다.
Faheem Mitha

1
@EpiGrad : David가 마음에 든다면 TikZ에 대해 구체적으로 묻는 것이 tex.sx에서 더 유용하다는 것을 의미했습니다. 물론 더 넓은 문제는 tex.sx에 관한 주제가 아닙니다.
Faheem Mitha

1
pgfplots는 꽤 놀랍습니다. 기본적으로 본문 텍스트와 일치하는 상자 모양의 벡터 선명한 레이블 등 원하는 방식과 거의 비슷합니다. 그러나 조정하기도 쉽습니다. 내가 가장 좋아하는 트릭은 Matlab 의사 컬러 플롯에서 축을 제거하고 자른 다음 TikZ에서 축을 감싸는 것입니다. 이렇게하면 의사 색상에 대한 래스터 이미지 (래스터 그래픽이 선호되는 몇 안되는 경우 중 하나임)와 축 및 레이블에 대한 LaTeX의 우수성, 심지어 색상 막대도 얻을 수 있습니다. 이 pgfplots를 사용하여 내 대답 중 하나입니다
qubyte

6

그래프를 좋게 만드는 것보다 불량 그래프를 구성하는 것을 특징 짓는 것이 훨씬 쉽습니다.

불량 그래프의 일부 기능 :

  • 지나치게 크거나 작은 글꼴 및 기호
  • 커브 및 기타 그래프 피처에 대한 너무 얇거나 두꺼운 선
  • 너무 많은 변수가 동시에 표시되거나 변하는 경우
  • 부적절한 축 선택 (로그 대 선형, 범위 등)
  • 존재하지 않을 수있는 진행 상황이나 동작을 나타내는 곡선이있는 데이터 포인트 간 추세 표시
  • 불확실성 또는 오류의 규모를 나타내지 않음
  • 자막이 있거나 레이블이 지정된 그래프 (단위 포함)

그러나 대부분의 소프트웨어 패키지는 좋은 그래픽을 만들 수 있지만 기본적 으로 좋은 그래픽을 생성하는 상태로 작업 한 프로그램은 거의 없습니다 . 글꼴 크기 나 표시 범위, 축 또는 기호 선택 등 항상 조정이 필요합니다. 현재는 matplotlib를 선호합니다. 내 그룹의 다른 사람들이 SciDavis로 마이그레이션했습니다.


"오류 표시 없음"이 무슨 뜻인지 잘 모르겠습니다. 당신은 명확히 할 수 있습니까? 그렇지 않으면 좋은 목록입니다.
Faheem Mitha

명확성을 위해 편집 : "불확실성 또는 오류의 크기를 나타내지 않음." 그러나 오류가 너무 작아 표시 할 수없는 경우 캡션에 표시 될 수 있습니다.
aeismail

5

Mathematica 패키지 LevelScheme을 사용하여 합리적인 성공을 거두었 습니다. . 실행 모델은 전통적인 Mathematica 프로그래밍과 약간 다르므로 사용과 관련된 학습 곡선이 있습니다. 그러나 일반 수학에서는 어려운 생성을 플롯하기 위해 미세한 제어 기능을 제공 할 수 있습니다. 또한 사이드 패키지로 사용자 지정 눈금 표시를 생성하기위한 패키지가 있습니다.

(Mathematica v.8을 지원하는 버전이 나오면 SciDraw로 이름이 변경됩니다.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.