분산 분석이란 무엇인지 시각적으로 설명 할 수있는 방법은 무엇입니까?
모든 참조, 링크 (R 패키지?)를 환영합니다.
분산 분석이란 무엇인지 시각적으로 설명 할 수있는 방법은 무엇입니까?
모든 참조, 링크 (R 패키지?)를 환영합니다.
답변:
개인적으로 선형 회귀 분석과 분산 분석이 모두 동일하고 선형 모형이 전체 분산을 분할하는 데 도움이된다는 것을 보여줌으로써 선형 회귀 분석과 분산 분석을 도입하는 것을 좋아합니다. 부분 ( '잔여'). 나는 일반적으로 다음 그림을 사용합니다 (총 변동성의 경우 회색 선, 그룹 또는 개인의 특정 변동성의 경우 검정 선).
나는 또한 Michael Friendly와 John Fox 의 heplots R 패키지를 좋아 하지만 다변량 선형 모델의 Visual Hypothesis Tests : The heplots Package for R도 참조하십시오 .
ANOVA가 실제로 무엇을하는지, 특히 선형 모델 프레임 워크에서 실제로 설명하는 표준 방법 은 Christensen의 복잡한 질문에 대한 비행기 답변 에서 실제로 잘 설명되어 있지만 그림은 거의 없습니다. Saville and Wood의 통계적 방법 : 기하 적 접근 방식 에는 몇 가지 예가 있지만 주로 회귀에 관한 것입니다. DoE에 주로 초점을 둔 몽고메리의 실험 설계 및 분석에는 내가 좋아하는 그림이 있지만 아래를 참조하십시오.
(이것들은 내 :-)
그러나 Wikipedia에 표시된 것처럼 제곱합, 오류 등이 벡터 공간으로 어떻게 변환되는지 보려면 선형 모델에 대한 교과서를 찾아야한다고 생각합니다 . 데이비슨 (Davidson)과 맥키 논 (MacKinnon)의 Econometrics의 추정과 추론 은 훌륭한 그림을 가지고있는 것 같지만 (제 1 장은 실제로 OLS 지오메트리를 다루고 있음) 프랑스어 번역 만 찾아 볼 수 있습니다 ( 여기에서 사용 가능 ). 선형 회귀의 기하학 에도 좋은 예가 있습니다.
편집하다 :
아, 그리고 저는이 기사를 Robert Pruzek의 일원 분산 분석을위한 새로운 그래픽으로 기억합니다 .
편집 2
그리고 이제 granova의 패키지 (@ gd047를 언급하고 상기 논문에 연관된)는, ggplot 볼 이식 된 granovaGG을 아래 일방향 ANOVA하는 도면으로.
지금까지 큰 답변을 주셔서 감사합니다. 그들이 매우 깨달은 곳에서, 나는 현재 가르치고있는 과정 (잘, TA'ing)에 그것들을 사용하는 것이 나의 학생들에게는 너무 많은 것이라고 느꼈습니다. (의학을 전공 한 학생들에게 BioStatistics 과정을 가르치는 데 도움을줍니다)
따라서 두 가지 이미지 (모두 시뮬레이션 기반)를 작성하여 분산 분석을 설명하는 데 유용한 예라고 생각했습니다.
개선을위한 의견이나 제안을 읽어 드리겠습니다.
첫 번째 이미지는 3 개의 플롯으로 분리 된 30 개의 데이터 포인트 시뮬레이션을 보여줍니다 (MST = Var가 MSB 및 MSW를 생성하는 데이터로 분리되는 방법을 보여줍니다).
두 번째 이미지는 4 개의 플롯을 보여줍니다. 각 플롯은 그룹에 대한 분산과 기대의 다른 조합에 대해
Hadley Wickham의 프레젠테이션을 확인하십시오 ( pdf , mirrorggplot )을 확인하십시오. 이 문서의 23-40 페이지에서 시작하여 분산 분석 시각화에 대한 흥미로운 접근법을 설명합니다.
* 링크 : http://had.co.nz/ggplot2/
좋은 질문입니다. 알다시피, 나는 오랫동안 ANOVA 주위에 내 머리를 감쌀 때 어려움을 겪었습니다. 나는 항상 "내와 사이의"직관으로 돌아가는 것을 발견하고, 항상 이것이 내 머리에서 어떻게 보일지 상상하려고 노력했습니다. 이 질문이 생겨서 기쁘고 위의 답변에서 다양한 접근 방식에 놀랐습니다.
어쨌든, 오랫동안 (몇 년, 심지어조차) 나는 여러 곳에서 동시에 일어나는 일을 볼 수있는 한 곳에서 여러 줄거리를 수집하고 싶었습니다 .1) 인구 가 얼마나 떨어져 있는지 , 2) 어떻게 멀리 떨어져 데이터가 있으며, 3) 얼마나 큰의 사이에 받는 비교 에서 , 4) 어떻게 중앙 대 noncentral을 F 분포 비교?
정말 큰 세상에서 슬라이더로 놀아 샘플 크기 를 확인할 수도 있습니다. 가 바뀌는 .
그래서 나는 RStudio 에서 manipulate
명령을 가지고 놀고 있었고 , 암소는 작동합니다! 다음은 플롯 중 하나 인 스냅 샷입니다.
RStudio가 있다면 위의 플롯 (슬라이더와 모두)을 만들기위한 코드를 얻을 수 있습니다! 여기 Github에 있습니다 .
이것을 잠시 동안 사용한 후, 나는 F 통계량이 그룹을 얼마나 잘 구분하는지, 심지어 작은 표본 크기에서도 얼마나 잘 구분되는지에 놀랐습니다. 내가 인구를 볼 때, 그들은 실제로 그렇게 멀지 않습니다 (내 눈에). 그러나 "내부"막대는 "사이"막대에 의해 지속적으로 왜소합니다. 매일 무언가를 배우십시오.
배가 이미 해답으로 항해 한 것처럼 보이지만, 이것이 입문 과정이라면 여기에 제공되는 대부분의 디스플레이가 입문 학생들에게 이해하기가 너무 어려울 것입니다. 입문 분산에 대한 매우 간단한 설명을 제공하는 소개 디스플레이가 없으면 파악하기가 어렵습니다. 과목 수에 따라 SST 총점이 어떻게 증가하는지 보여줍니다. 그런 다음 여러 주제에 대해 팽창 한 것으로 나타난 후 (각 그룹에 하나씩 추가 할 수 있음) SST = SSB + SSW라고 설명하십시오. (초기부터 SSE라고 부르는 것이 좋습니다. ). 그런 다음 분산 분할의 시각적 표현, 예를 들어 SST가 SSB 및 SSW로 구성되는 방식을 볼 수 있도록 코딩 된 큰 정사각형 색상을 보여줍니다. 그때,