다양한 조건에서 두 숫자 변수 간의 그래프 연결에 대한 팁이있는 우수한 온라인 리소스


22

문맥:

그 동안 나는 두 숫자 변수 사이의 연관성을 효과적으로 구성하는 방법에 대한 일련의 휴리스틱을 얻었습니다. 데이터를 다루는 대부분의 사람들이 비슷한 규칙을 가지고 있다고 생각합니다.

이러한 규칙의 예는 다음과 같습니다.

  • 변수 중 하나가 양으로 치우친 경우 해당 축을 로그 스케일로 플로팅하는 것을 고려하십시오.
  • 많은 데이터 포인트가있는 경우 (예 : n> 1000), 일부 형태의 부분 투명도 사용 또는 데이터 샘플링과 같은 다른 전략을 채택하십시오.
  • 변수 중 하나가 제한된 수의 개별 범주를 사용하는 경우 지터 또는 해바라기 플롯을 사용하는 것이 좋습니다.
  • 세 개 이상의 변수가 있으면 산점도 행렬 사용을 고려하십시오.
  • 어떤 형태의 추세선을 맞추는 것이 종종 유용합니다.
  • 플로팅 문자의 크기를 샘플 크기로 조정합니다 (n이 클수록 작은 플로팅 문자 사용).
  • 등등.

의문:

학생들에게 두 개의 숫자 변수 사이의 연관성을 효과적으로 플롯하기위한 이러한 트릭과 기타 트릭을 설명하는 웹 페이지 또는 사이트를 학생들에게 소개하고 싶습니다.

  • 인터넷에 잘 작동하는 페이지 나 사이트가 있습니까?

2
구할 수 있다면 Systat의 이전 사본 (Windows 이전, 믿거 나 말거나)과 함께 제공되는 인쇄 된 "그래픽"설명서는 훌륭한 자료가 될 것입니다. 이 규칙을 모두 설명했을뿐 아니라 (불쾌한) 충고와 충고가 충만했습니다.
whuber

2
@ whuber, 좋은 의견. Systat의 기본 저자이자 통계 그래픽보다 컴퓨터 과학 책인 The Grammar of Graphics 의 저자 인 Leland Wilkinson 은 데이터를 그래픽으로 표시하는 데 매우 적합합니다. 그의 프레젠테이션은 항상 메시지를 전달하는 데 매우 효과적입니다.
StasK

@ Jeeromy, 당신은 이미 R 용 ggplot2 패키지를 알고있을 것 입니다. 그러나 그래픽의 문법이 언급되었으므로 언급 할 생각이었습니다. Hadley Wickham 의 패키지, 서적 및 온라인 참조 매뉴얼 은 숫자 변수를 유용한 플롯과 그래픽으로 변환하는 데 매우 유용합니다.
NRH

1
@Jeromy 왜 규칙 당 하나의 게시물을 요청하여 커뮤니티 위키로 질문을 별도로 바꾸지 않겠습니까? 그렇게하면 링크 세트가 아니라, 규칙적인 규칙 세트를 만들고 여기에서 리소스를 만들 수 있습니다.
David LeBauer

@David 좋아요, 저는 플롯 디자인을위한 최고의 리소스에 관한 일반적인 커뮤니티 위키 질문을 추가했습니다. stats.stackexchange.com/questions/16631/…
Jeromy Anglim

답변:


13

나는 머리 위로 멋진 온라인 자료를 생각할 수 없지만, 사려 깊게 큰 다차원 데이터 세트를 시각적으로 탐색하는 방법을 설명하는 멋진 (그리고 쉽게 다운로드 할 수있는) 책 장은 Brendan O'Connor와 Lukas Biewald 's입니다. 장 (경고 : 링크가 PDF로 바로)에서 아름다운 데이터 . 이 장은 설명에 R 코드를 통합하기 때문에 특히 교육 자료로 유용합니다.

또한, 더 자세히 살펴보면 John Tukey의 고전적인 "일부 그래픽 및 세미 그래픽 디스플레이" (편리하게 Edward Tufte 웹 사이트에 게시 됨)는 시각적으로 약간 특이하지만 소개는 정말 훌륭하다고 생각합니다.

어떤 이유로, 나는 책 장을 생각하고있는 것 같습니다 ...


+1 최소한이 챕터는 웹에서 구할 수 있습니다. 고마워, 애런
whuber

현상금을 게시 주셔서 감사합니다 @ whuber; @ashaw와 두 링크 모두 흥미로운 독서를 제공합니다.
Jeromy Anglim

나는 Tukey 논문이 그의 책 EDA (1977) 에서 발견 된 확장 된 치료의 전임자라는 것을 알아 차렸다 (루토 그램과 히스토그램 매달 기의 마지막 부분은 제외).
whuber

11

최근 참조 :

오래되었지만 관련 자료


3
+1 규칙과 튜토리얼은 유용하고 포괄적이며 금지되어 있습니다! 단일 일러스트레이션을 제공하지 않고 그래픽에 대해 어떻게 글을 쓸 수 있습니까? :-)
whuber

1
선택은 어려웠지만 전반적으로 질문에 가장 잘 부합하기 때문에이 답장에 현상금을 수여했습니다. UN 문서는 평범한 언어와 많은 분명한 예와 함께 학생들에게 특히 유용하고 접근 가능한 것으로 보입니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.