바이올린 음모 해석


9

바이올린 플롯을 사용하여 다른 그룹의 분포를 비교하고 있지만 찾은 대부분의 온라인 리소스는 플롯을 만드는 방법과 결과의 기본 해석 (중간 변형, 데이터 클러스터링 여부)과 관련이 있습니다.

바이올린 음모를 올바르게 해석하기위한 지침으로 따를 수있는 자세한 예를 찾고 있습니다.

답변:


9

바이올린 음모는 히스토그램 (또는 커널 밀도와 같은 부드러운 변형)이 옆으로 향하고 대칭됩니다. 히스토그램을 해석하는 방법을 가르치는 교과서에는 원하는 직관력이 있어야합니다. Nick Cox의 제안에 따라 편집 : Freedman, Pisani, Purves, Statistics 는 막대 그래프를 다룹니다.

보다 공식적인 방식으로 해석하는 한, 분포를 그래프로 나타내는 요점은 통계 테스트가 어리석은 것을 보는 것입니다.

바이올린 플롯과 관련된 한 가지 방법은 중간 값, 평균 등의 행을 추가하는 것입니다. 때로는 상자 그림을 겹쳐서 요약 통계 방식으로 더 많은 것을 볼 수 있습니다.

최소한 처음 몇 순간 (평균, 분산, 왜도, 첨도)뿐만 아니라 이형성 및 특이 치에서 심한 편차를 찾을 수 있어야합니다.


2
+1, 유사한 플롯은 인구 피라미드 이며, 반사 분포는 다른 범주 일뿐입니다 (그리고 kde 대신 더 일반적인 히스토그램 유형 추정기를 사용합니다).
Andy W

1
탐색 데이터 분석 인 Tukey 나 그래프 데이터 요소 인 클리블랜드 (Cleveland) 는 히스토그램에 대해 많은 것을 말하지 않습니다. 둘 다 다른 표현에 더 관심이 있고 더 인상적입니다. 그 책이 여기에 언급 되었습니까? 히스토그램을 기본으로 다루는 한 권의 책은 Freedman, Pisani, Purves, Statistics 입니다.
Nick Cox

1
실제로, 클리블랜드 히스토그램에 대해 말하고 있습니다. 그는 그래프가 좋지 않으며 그의 책에는 사용되지 않을 것이라고 말했다. :-). 그리고 F, P, P는 훌륭한 책입니다.
Peter Flom

1
FPP에서 가르쳤습니다. 그들은 다변량 회귀를 명시 적으로 수행하지 않기 때문에 OLS를 사용하여 직사각형의 면적을 예측하지 않습니다. 그러나이 정신에는 몇 가지 예가 있습니다. 예를 들어, 갈릴레오가 물체가 선형 회귀에 의해 높이 h에서 떨어지는 데 걸리는 시간 t를 예측하려고하면 어떻게 될까요? 최소한의 제곱에 적합하지만 물론 진실은 입니다. 이야기의 교훈은 항상 잔차를 보는 ​​것입니다. t=ch
Michael Lugo

1
@TrevorAlexander 좋은 질문입니다. 나는 거울이 해석 될 때 해석이 더 나은 것을 보여주는 어떤 문헌도 알지 못한다. 그러나 그것들은 적어도 세로 방향으로 히스토그램보다 멋지게 보인다.
Ari B. Friedman
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.