먼저이 사이트에서 답변을 검색했다고 진술해야합니다. 내 질문에 대답 한 질문을 찾지 못했거나 지식 수준이 너무 낮아서 이미 답변을 읽은 것을 몰랐습니다.
AP 통계 시험을 준비 중입니다. 선형 회귀를 배워야하며 주제 중 하나는 잔차입니다. 253 페이지의 통계 및 데이터 분석 소개 사본이 있습니다.
이변 량 데이터 세트의 특이점은 산점도의 다른 점 대부분에서 방향 또는 방향으로 떨어진 점입니다.
관측치가 나머지 데이터에서 멀리 떨어져 있는 값 ( 방향으로 나머지 데이터와 분리 된) 이있는 경우 잠재적으로 영향력있는 관측치 입니다. 관측치가 실제로 영향을 미치는지 확인하기 위해이 관측치의 제거가 기울기 값에 가장 큰 영향을 미치는지 또는 최소 제곱 선의 절편에 큰 영향을 미치는지 평가합니다.
잔차가 큰 관측치는 특이 치 입니다. 이상치 관측은 방향 에서 최소 제곱 선에서 멀리 떨어져 있습니다 .
Stattreck.com 은 잔차에서 특이 치를 결정하는 네 가지 방법을 설명합니다.
전체 패턴과 크게 다른 데이터 포인트를 이상치라고합니다. 데이터 포인트가 특이 치로 간주 될 수있는 네 가지 방법이 있습니다.
- 다른 데이터 포인트에 비해 극단적 인 X 값을 가질 수 있습니다.
- 다른 데이터 포인트와 비교하여 극단적 인 Y 값을 가질 수 있습니다.
- 극단적 인 X 및 Y 값을 가질 수 있습니다.
- 극단적 인 X 또는 Y 값이 없어도 나머지 데이터와 거리가 멀 수 있습니다.
이 두 출처는 서로 충돌하는 것 같습니다. 누구든지 내 혼란을 해결하는 데 도움이 될 수 있습니까? 또한 극한을 어떻게 정의합니까? 데이터 포인트가 (Q1-1.5IQR, Q3 + 1.5IQR) 외부에있는 경우 AP 통계는 규칙을 사용합니다. 잔차에서 그래프로 적용하는 방법을 모르겠습니다.