'bagplot'또는 'bivariate boxplot'이란 무엇입니까?


11

상자 그림 의 다차원 (여기서는 이변 량) 버전을 소개 하는 종이찾았 습니다. 그 bagplot은 정확히 무엇입니까? 정점을 기반으로 일련의 중첩 다각형을 볼 수 있는데, 그 중 하나는 백 플롯으로 선언됩니다. 중첩 다각형 빌딩의 아이디어는 무엇입니까? 백 플롯 (중앙 또는 평균 포인트 수를 보유)은 어느 다각형입니까? 백 플롯의 모서리에 유용한 특성 (점 세트를 구체적으로 나누는 것과 같은)이 있습니까?


3
미국 통계 학자 Rousseeuw, Pits 및 Tukey의 기사가 있습니다. 나는 어떤 이유로 링크를 붙여 넣는 데 문제가 있지만 인터넷 검색 "bagplot"과 "Tukey"가 그것을 발견 할 것입니다.
Peter Flom

1
터무니없는 가격으로 만 찾았습니다. 아직 찾고있는 중.
mbaitoff

1
괜찮은 라이브러리에 액세스 할 수 있으면 라이브러리가 있어야합니다. American Statistician은 꽤 널리 구독되어 있습니다. quora에도 무언가가 있었지만 나는 그것을 보지 않았습니다.
Peter Flom

2
Rousseeuw와 Ruts는 미국 통계 학자 외에 포스트 스크립트 형식 의 무료 기사를 온라인 으로 제공합니다.
Andy W

@AndyW, SPSS 동료에게 묻기 : 어떻게 GPL을 통해 어떻게 할 수 있다고 생각하십니까? 우리 SPSSers를위한 코드를 발명 할 예정입니까?
ttnphns

답변:


13

다음은 메모가 포함 된 예입니다.

The Bagplot: A Bivariate BoxplotPeter J. Rousseeuw, Ida Ruts & John W. Tukey 의 기사는 다음과 같습니다 The American Statistician. http://venus.unive.it/romanaz/ada2/bagplot.pdf

그 기사의 요약에서 :

"깊이 중앙값"은 가장 깊은 위치이며 가장 큰 깊이의 n / 2 관측치가 포함 된 "가방"으로 둘러싸여 있습니다. 백을 3 배로 확대하면“울타리”(그림이 표시되지 않음)가 생성됩니다. 백과 펜스 사이의 관찰은 밝은 회색 루프로 표시되며 펜스 외부의 관찰은 특이 치로 표시됩니다. 백 플롯은 데이터의 위치, 분산, 상관 관계, 왜도 및 꼬리를 시각화합니다.

주요 부분은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

추가 토론은 다음에서 찾을 수 있습니다.

패키지 의 도움말 문서 aplpack( R사용자 용)에서 :

백 플롯은 잘 알려진 박스 플롯의 이변 량 일반화입니다. Rousseeuw, Ruts 및 Tukey가 제안했습니다. 이변 량 사례에서 상자 그림의 상자는 볼록 선체 인 bagplot의 가방으로 바뀝니다. 가방 안에는 모든 포인트의 50 %가 있습니다. 울타리는 울타리의 점을 외부 점과 분리합니다. 백을 늘리면 계산됩니다. 루프는 펜스 내부의 모든 점을 포함하는 볼록 다각형으로 정의됩니다. 모든 점이 직선에 있으면 고전적인 상자 그림이 나타납니다. bagplot ()은 Rousseeuw et al. 비고 : 2 차원 중앙값은 근사치입니다. 작은 데이터 세트에는 알려진 어려움이 있지만 (예를 들어 10 점의 (그래픽) 요약을 만드는 것이 현명하지 않다고 생각합니다.)

사람들이 여러 (overlappIng) 백 플롯을 플로팅하려는 경우 플롯이 반투명 한 경우 편리합니다. 이러한 이유로 투명 플래그가 bagplot 명령에 추가되었습니다. transparency == TRUE이면 알파 레이어가 '99'(16 진수)로 설정됩니다. 이렇게하면 백 플롯이 반투명으로 표시되지만 출력 장치가 PDF이고 pdf (file = "filename.pdf", version = "1.4")를 사용하여 열린 경우에만 해당됩니다. 이러한 이유로, 기본값은 transparency == FALSE입니다. Wouter Meuleman은이 기능과 다양한 색상을 지정하는 인수를 제안했습니다.

그리고 예 :

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

여기에 이미지 설명을 입력하십시오

관련 질문 :


4
업데이트 : 누군가가 ggplot2 geom을 만들었습니다 : gist.github.com/benmarwick/00772ccea2dd0b0f1745 . 아마도 진취적인 사용자가 이것을 패키지로 바꿀 수 있을까요?
shadowtalker
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.