필자의 분야에서 짝을 이룬 데이터를 그리는 일반적인 방법은 일련의가는 경 사진 선분으로 두 그룹에 대한 중앙값의 중앙값과 CI로 오버레이합니다.
그러나이 종류의 줄거리는 데이터 포인트 수가 매우 많아지면 읽기가 훨씬 어려워집니다 (제 경우에는 10000 쌍 정도입니다).
알파를 줄이면 약간 도움이되지만 여전히 좋지는 않습니다. 솔루션을 검색하는 동안 이 백서 를 발견하고 '병렬 라인 플롯'을 구현하기로 결정했습니다. 다시 말하지만 적은 수의 데이터 포인트에 매우 훌륭하게 작동합니다.
그러나 이 매우 클 때 이런 종류의 음모를보기 좋게 만드는 것은 더 어렵습니다 .
박스 플로트 또는 바이올린과 같이 두 그룹에 대한 분포를 별도로 표시하고 상단에 두 개의 중앙값 / CI를 표시하는 오류 표시 줄이있는 줄을 그릴 수 있다고 생각하지만 실제로는 그 아이디어가 마음에 들지 않습니다. 데이터의 특성
나는 또한 2D 산점도에 대한 생각에 지나치게 열중하지 않습니다. 더 컴팩트 한 표현을 선호하고 두 그룹의 값이 같은 축을 따라 그려지는 것이 이상적입니다. 완전성을 위해 데이터는 2D 분산 형처럼 보입니다.
누구든지 매우 큰 표본 크기로 쌍을 이룬 데이터를 표현하는 더 좋은 방법을 알고 있습니까? 몇 가지 예를 연결해 주시겠습니까?
편집하다
미안하지만, 내가 찾고있는 것을 설명하는 데 충분한 일을하지 못했습니다. 예, 2D 산점도는 효과가 있으며 점의 밀도를 더 잘 전달하기 위해 향상시킬 수있는 여러 가지 방법이 있습니다. 커널 밀도 추정에 따라 점을 색상으로 코딩 할 수 있으며 2D 히스토그램을 만들 수 있습니다 , 등 도트 위에 등고선을 그릴 수 있습니다 ...
그러나 나는 이것이 전달하려는 메시지에 대해 과도하다고 생각합니다. 나는 실제로 2D 밀도의 점 자체를 보여주는 것에 신경 쓰지 않습니다. 필요한 것은 '막대'의 값이 가능한 한 간단하고 명확한 방법으로 '점'의 값보다 일반적으로 더 크다는 것을 보여주는 것입니다. 그리고 데이터의 본질적인 쌍성을 잃지 않고. 이상적으로는 직교 축이 아닌 동일한 축을 따라 두 그룹의 쌍을 이루는 값을 플로팅하고 싶습니다. 시각적으로 쉽게 비교할 수 있기 때문입니다.
산포도보다 더 나은 옵션은 없지만 작동 할 수있는 대안이 있는지 알고 싶습니다.
bar
가로축과dot
세로축 의 해당 값을 산점도로 플로팅하려고 했습니까 ?