오차와 잔차의 차이는 무엇입니까?


20

이 두 가지 유비쿼터스 용어는 종종 동의어로 사용되지만 때로는 구별이있는 것 같습니다. 실제로 차이가 있습니까, 아니면 정확히 동의어입니까?


시간이있는 경우 Qin & Gilbert "시계열 측정기 역사의 오류 용어" 에서 포괄적 인 처리 방법을 확인하십시오. 아, 그러나 이것은 시계열 데이터에만 해당됩니다.
Richard Hardy

답변:


20

오차 는 실제 데이터 생성 프로세스 (DGP)와 관련이 있으며 잔차 는 모델을 추정 한 후에 남은 것입니다. 사실, 정규성, 동질성 및 독립성과 같은 가정은 모델의 잔차가 아닌 DGP의 오차에 적용됩니다. (예를 들어,모델에매개 변수를 적합하게하면잔차 만 독립적 일 수 있습니다.) 그러나 잔차에만 액세스 할 수 있으므로 우리가 작업하는 것입니다. N - ( P + 1 )p+1N(p+1)


9
(+1) 잔차는 오차의 추정치 로 간주 될 수 있습니다 .
Scortchi-Monica Monica 복원

@ABC DGP데이터 생성 프로세스를 나타냅니다 . 모델이 적절하고 DGP의 실제 구조를 반영하더라도, 잔차가 기본 오차가 아닌 경우 반드시 정상적이고, 동질적이고 독립적 일 필요는 없습니다.
gung-복직 모니카

@Scortchi 안녕하세요, 귀하의 의견에 대한 언급이 있습니까? 실제 가정이 오류의 정상일 때 회귀 분석에서 잔차의 정규성을 확인하는 사람들을보고 정확한 이유를 정확히 알지 못하기 때문에 왜 정확하게 잔차를 오차의 추정치로 사용할 수 있는지 이해하려고합니다.
Austin

@Austin, 여전히 관심이 있다면 새로운 질문을해야합니다.
gung-Monica Monica 복원

13

에러가 관측 값합니다 (DGP 의해 생성 자주 관측) 참값 사이의 차이이다.

잔차 관측 값 (모델에 의한) 상기 예측 된 값 사이의 차이이다.


오류가 "매우 자주 관찰되지 않음 "에 대한 응답으로 우리 는 절대 절대 값을 절대 관찰 할 수 없었습니다 . 모든 측정 장치에는 측정 장치 고유의 유한 오류가 있습니다. 당신이 주장 할 수있는 가장 좋은 점은 측정 오차 + / 측정 오차 또는 측정 오차와 같은 점에서 실제 값이 동일하다는 것입니다. 예를 들어, 눈금자가 거리를 1mm까지 늘릴 수 있으므로 연필은 0.1mm 이내 입니다. 이것은 체계적인 오류와 다릅니다. 예를 들어, 제 통치자는 제조 과정에서 다소 뻗어 있었고 너무 오래 측정했습니다. ±
Steven C. Howell

이 링크 ( ece.rochester.edu/courses/ECE111/error_uncertainty.pdf )는 해당 주제에 대한 Bevington 및 Taylor의 텍스트를 참조하여 좋은 설명을 제공합니다.
Steven C. Howell

기계 학습 언어에서 잔류 오차는 훈련 오류이고 오류는 테스트 오류입니까?
Charles Chow

@CharlesChow 사용하는 데이터 세트에 따라 다릅니다. 훈련 세트를 사용하면 훈련 오류입니다. 테스트 세트를 사용하면 테스트 오류입니다.
Leopold W.

7

오차항은 절대로 관찰 할 수없는 이론적 인 개념이지만 잔차는 회귀 분석이 수행 될 때마다 계산되는 실제 값입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.