문맥:
그 동안 나는 두 숫자 변수 사이의 연관성을 효과적으로 구성하는 방법에 대한 일련의 휴리스틱을 얻었습니다. 데이터를 다루는 대부분의 사람들이 비슷한 규칙을 가지고 있다고 생각합니다.
이러한 규칙의 예는 다음과 같습니다.
- 변수 중 하나가 양으로 치우친 경우 해당 축을 로그 스케일로 플로팅하는 것을 고려하십시오.
- 많은 데이터 포인트가있는 경우 (예 : n> 1000), 일부 형태의 부분 투명도 사용 또는 데이터 샘플링과 같은 다른 전략을 채택하십시오.
- 변수 중 하나가 제한된 수의 개별 범주를 사용하는 경우 지터 또는 해바라기 플롯을 사용하는 것이 좋습니다.
- 세 개 이상의 변수가 있으면 산점도 행렬 사용을 고려하십시오.
- 어떤 형태의 추세선을 맞추는 것이 종종 유용합니다.
- 플로팅 문자의 크기를 샘플 크기로 조정합니다 (n이 클수록 작은 플로팅 문자 사용).
- 등등.
의문:
학생들에게 두 개의 숫자 변수 사이의 연관성을 효과적으로 플롯하기위한 이러한 트릭과 기타 트릭을 설명하는 웹 페이지 또는 사이트를 학생들에게 소개하고 싶습니다.
- 인터넷에 잘 작동하는 페이지 나 사이트가 있습니까?