잔차가 "예측 마이너스 실제"또는 "실제 마이너스 예측"입니까?


46

"잔여 물"은 "예측 마이너스 실제 값"또는 "실제 마이너스 예측 값"으로 다양하게 정의 된 것을 보았습니다. 설명을 위해 두 수식이 널리 사용됨을 나타내려면 다음 웹 검색을 비교하십시오.

실제로, 개별 잔차의 부호는 일반적으로 중요하지 않기 때문에 (예를 들어, 제곱되거나 절대 값이 취해지는 경우) 거의 차이가 없습니다. 그러나 내 질문은 : 이 두 버전 중 하나 (예측 우선 대 실제 첫 번째)가 "표준"으로 간주됩니까? 나는 일관되게 사용하고 싶기 때문에 잘 확립 된 기존 표준이 있다면 그것을 따르는 것을 선호합니다. 그러나 표준이 없으면 표준 규칙이 없다는 것이 확실하게 입증 될 수 있다면 그 대답으로 받아들이게되어 기쁩니다.


8
잔차가 모형의 오차에 연결되어 있기 때문에 을 쓸 때 는 "고정 된 부분"에 "무작위 부분"을 더한 것으로 생각 되므로 잔차는 에서 . y=a+bx+ϵyya+bx
AdamO

예측 된 마이너스 실제 또는 실제 마이너스 예측예측 오차 (또는 그 마이너스)이고, 적합 마이너스 실제 또는 실제 마이너스 적합 은 잔류 (또는 그 마이너스) 일 것이다. Stephen Kolassa의 답변 은 이유에 대한 예측 오류 를 언급 합니다 .
Richard Hardy

나는 (예측 된) 실제 작업이 더 편리하다는 것을 알았습니다. 종종 일부 매개 변수와 관련하여 잔차의 미분 값을 계산해야합니다. (실제로 예측 된)을 사용하는 경우 마이너스 기호는 나머지 계산에서 계속 추적해야하므로 더 많은 괄호를 사용해야하며 이중 네거티브가 발생할 때 등을 취소해야합니다. 내 경험상, 이것은 더 많은 오류로 이어진다
Nick Alger

답변:


42

잔차는 항상 실제 마이너스 예측입니다. 모델은 다음과 같습니다. 따라서 잔차 은 오류 추정치입니다 :

y=f(x;β)+ε
ε^ε
ε^=yy^y^=f(x;β^)

나는 @ whuber에 서명이 수학적으로 중요하지 않다는 것에 동의합니다. 그래도 컨벤션을 갖는 것이 좋습니다. 그리고 현재의 관습은 내 대답과 같습니다.

OP 가이 주제에 대한 나의 권위에 도전했기 때문에 다음과 같은 참고 문헌을 추가하고 있습니다.


3
잔차가 항상 실제 마이너스 예측이 아님을 분명히 보여주는 샘플 웹 검색을 추가하기 위해 질문을 편집했습니다. 대체물도 상당히 빈번하므로 혼동됩니다. 내 질문은 올바른 협약에 대한 권위있는 문서가 있는지 여부이며, 불행히도 귀하의 답변은 제공하지 않습니다.
Tripartio

5
내 독서에서 관찰 통계의 가장 현대적인 규칙이 예측됩니다. 그러나 가우스가 반대의 규칙을 사용했다는 것은 주목할 만하다. 자연적으로 제곱 된 잔차는 최소 제곱, 제곱합 또는 평균 제곱의 맥락에서 동일하다. 개별 잔차를 살펴보기위한 19 세기 이전의 전례가 있지만, 잔차를 돌보고 특히 잔차를 꾸미는 것은 1960 년대 초까지 널리 퍼지기 시작하지 않았습니다. 즉, 잔차 표시가 보이면 누구나 그것이 무엇인지 신경 써야한다는 것입니다.
Nick Cox

18
+1. 잔차의 개념은 "나머지; 남은"에서 비롯됩니다 . 즉, 예측 후 데이터에 남아 있는 것은 무엇입니까 ? 이는이 수량을 "잔여"로 지정한 사람은 "데이터 값에서 적합치 빼기"라는 정의를 염두에두고 있음을 나타냅니다.
whuber

3
@NickCox, 인용과 함께 귀하의 의견을 답변으로 공식화 해 주시겠습니까? 제 질문은 과학적 컨벤션에 관한 것만 큼 통계에 관한 것이 아닙니다. 따라서 귀하의 의견에 표시된 역사적 및 사용 통찰력의 종류는 내가 찾고있는 답변입니다.
Tripartio

6
단어의 잔류는 오래, 오래 Salsburg 선행한다. 그의 책은 때로는 재미 있기는하지만 권위있는 책과는 거리가 멀다. 관심이 있으시면 Biometrics jstor.org/stable/3068274
Nick Cox

22

방금 하나의 대답 올바른 것 인 매력적인 이유 를 발견 했습니다 .

회귀 (및 모든 종류의 통계 모델)는 반응의 조건부 분포가 설명 변수에 어떻게 의존하는지에 관한 것입니다. 이러한 분포의 특성을 결정하는 중요한 요소는 일반적으로 "비대칭 (skewness)"이라고하는 척도입니다 (다양하고 다른 공식이 제공 되었음에도 불구하고). 분포 형태가 대칭에서 벗어나는 가장 기본적인 방법을 나타냅니다. 다음은 양의 비뚤어진 조건부 응답 이있는 이변 량 데이터 (응답 및 단일 설명 변수 )의 예입니다.yx

! [그림 1 : 최소 정사각형 선이있는 산점도.

파란색 곡선은 일반적인 최소 제곱 적합입니다. 적합 값을 플로팅합니다.

응답 와 적합치 의 차이를 계산할 때 조건부 분포의 위치는 이동 하지만 모양은 변경하지 않습니다. 특히, 왜도는 변경되지 않습니다.yy^

그림 2 : 잔차 대 예측값

이것은 이동 된 조건부 분포가 예측 된 값과 어떻게 다른지 보여주는 표준 진단 플롯입니다. 기하학적으로, 그것은 이전의 산점도를 "완료"할 때와 거의 동일합니다.

대신 다른 순서 인 의 차이를 계산 하면 조건부 분포의 모양 이 바뀌고 반전 됩니다. 왜도는 원래 조건부 분포의 음수입니다.y^y,

그림 3 : 잔차가 무시 된 이전 그림

이것은 이전 그림과 동일한 수량을 보여 주지만 잔차는 적합치에서 데이터를 빼서 계산했습니다. 물론 이전 잔차를 무시하는 것과 같습니다.

앞의 두 그림이 모든면에서 수학적으로 동일하지만 하나는 단순히 푸른 수평선을 가로 질러 점을 뒤집어 다른 것으로 변환하지만 그 중 하나는 원래 그림과 훨씬 더 직접적인 시각적 관계를 갖습니다.

결과적으로 우리의 목표는 잔차의 분포 특성을 원래 데이터의 특성과 연관시키는 것이며 (거의 항상 그렇습니다) 응답을 이동 및 반전시키는 대신 단순히 이동하는 것이 좋습니다.

정답은 분명합니다. 잔차를 로 계산하십시오yy^.


1
나는 왜 왜곡에 대한 특별한 것을 따르지 않는다고 생각합니다. 원래 플롯과 일치하는 잔차에 대한 당신의 주장은 바로 저절로 서 있지 않습니까?
MichaelChirico

2
@Michael 당신은 꽤 정확합니다. 그러나 왜도는 분포의 모양을 음의 모양과 명확하게 구분하기 때문에 점을 설명하는 데 유용합니다.
whuber

10

Green & Tashman (2008, Foresight )은 예측 오류에 대한 유사한 질문에 대한 작은 설문 조사에 대해보고합니다. 나는 그들에 의해보고 된 바와 같이 어느 하나의 협약에 대한 논쟁을 요약 할 것이다 :

"실제 예측 된"인수

  1. 통계 규칙은 입니다.y=y^+ϵ
  2. 지진학의 적어도 한 응답자는 이것이 또한 지진파 이동 시간을 모델링하기위한 관습이라고 썼다. "모델에 의해 예측 된 시간 이전에 실제 지진파가 도착하면 음의 이동 시간 잔차 (오류)가 있습니다." ( sic )

  3. 를 예산, 계획 또는 목표로 해석하는 경우이 규칙이 적합합니다 . 여기에서 양수 오류는 예산 / 계획 / 목표가 초과되었음을 의미합니다.y^

  4. 이 규칙은 지수 평활을 위한 공식을 보다 직관적으로 만듭니다. 부호를 사용할 수 있습니다 . 다른 규칙에서는 기호 를 사용해야합니다 .+

"예측 된 실제"에 대한 인수

  1. 경우 하고 긍정적 인 오류는 예측이 너무 높은 것을 나타냅니다. 이것은 대화보다 직관적입니다.y=y^ϵ

    이와 관련하여 양의 편향이 양의 예상 오차 로 정의 되는 경우이 규칙을 사용하면 예측이 평균적으로 너무 높다는 것을 의미합니다.

    그리고 이것은이 협약에 주어진 유일한 주장입니다. 다시 말하지만, 다른 관습으로 이어질 수있는 오해 (긍정적 오류 = 예측치가 너무 낮음)를 감안할 때 그것은 강력한 것입니다.

결국, 나는 그것이 당신의 잔재를 전달할 사람에게 달려 있다고 주장합니다. 그리고이 논의에는 분명히 두 가지 측면이 있다는 것을 감안할 때, 어떤 규칙을 따를 것인지 명시 적으로 언급하는 것이 좋습니다.


7
재미있는 점이지만, 누군가가 "직관적"이라고 말할 때마다 나는 "나에게 친숙하다"고 번역하고 더 설득력 있고 결코 적습니다. 이것을보십시오 : 아인슈타인 요약 규칙은 직관적입니다. 익숙해 졌을 때만. 축에서 시계 반대 방향으로 각도를 측정하는 것은 직관적입니다. 지리학 자나 좌표 지오메트리를 공부하기 전에 나침반 사용법을 배운 사람에게는 해당되지 않습니다. x
Nick Cox

3
@NickCox : 추상적으로, 당신 말이 맞습니다. 그러나 많은 수의 사람들을 대상으로 "오늘날의 날씨에 대한 일기 예보에는 긍정적 인 오류 가 많이있었습니다 . 예측이 (A) 너무 높 거나 (B) 너무 낮다고 생각 하십니까?" 압도적 다수가 (A) 또는 (B) 중 하나를 선택할 것이라고 예측할 수 있다고 생각합니다.
S. Kolassa-복원 모니카

6
예 - 당신이 같은 질문은 "당신은 온도가 (A)했다 믿습니까 것을 구한다면 더 높은 또는 (B) 낮은 당신이 아주 잘 정확하게 얻을 수있는 예측보다" 반대의 답변! "긍정적 오류"를 언급하는 것은 "오류가 무엇인가"라는 문제를 제기 할 뿐이며, 이는 우리를 완벽하게 순환하는 방식으로 원래의 질문으로 바로 되돌려줍니다.
whuber

2
@whuber 그것은 질문의 다소 부 자연스러운 표현입니다. "관측 된"이 "고정 된"것으로 가정하면, 모델과 모델의 관계는 다른 방식보다 자연스러워 보입니다. "제한 속도가 내 속도보다 낮습니다"가 아니라 너무 빨리가는 과속 티켓을받습니다. 자연어 논쟁은 확실히 기술 용어 / 언어에 제한적으로 적용됩니다
mbrig

2
@ whuber 내가 말하는 것은 질문을 표현하는 한 가지 방법이 분명히 더 자연 스럽습니다 (적어도 영어로).
mbrig

4

다른 용어는 다른 규칙을 제안합니다. "잔여"라는 용어는 모든 설명 변수가 고려 된 후에 남은 것, 즉 실제 예측 된 것을 의미한다. "예측 오류"는 예측이 실제, 즉 예측-실제와 얼마나 차이가 있는지를 나타냅니다.

모델링의 개념은 또한 어떤 컨벤션이 더 자연스러운 지에 영향을줍니다. 하나 이상의 기능 열 , 응답 열 및 예측 열 가있는 데이터 프레임이 있다고 가정합니다 .X=x1,x2...yy^

한 가지 개념은 가 "실제"값이고 는 단순히 변형 된 버전입니다 . 이 개념에서 와 는 모두 임의 변수입니다 ( 는 파생 변수 임). 하지만 우리가 실제로 관심있는 하나입니다, 우리가 관찰 할 수있는 하나입니다 위한 프록시로 사용되는 . "오류"는 이 "true"값 에서 가 얼마나 많이 벗어나 는지 입니다. 이는이 편차의 방향에 따라 오류를 정의하는 것을 제안합니다 (예 : .yy^Xyy^y^yy^y^yy^ye=y^y

그러나 를 "실제"값으로 생각하는 또 다른 개념이 있습니다. 즉, y는 결정 론적 과정을 통해 의존 한다. 의 특정 상태 는 특정 결정 론적 가치를 발생시킵니다. 이 값은 임의의 프로세스에 의해 혼란스러워집니다. 따라서 우리는 입니다. 이 개념에서 는 의 "실제"값입니다. 예를 들어 중력으로 인한 가속도 인 g의 값을 계산하려고한다고 가정합니다. 많은 물체를 떨어 뜨려 떨어 뜨린 거리 ( )와 떨어질 때까지 걸린 시간 ( )을 측정합니다. 그런 다음 y = 모델로 데이터를 분석하십시오.y^XXxf(X)f(X)+error()y^Xy2xg. 이 방정식이 정확하게 작동하는 g 값이 없다는 것을 알았습니다. 그런 다음 이것을 다음과 같이 모델링하십시오.

y^=2xg
y=y^+error .

즉, 변수 y를을하고 "진짜"가치가있을 생각이다 실제 물리 법칙에 의해 생성되고, 다음 몇 가지 다른 값 입니다 의 어떤 독립적 인 수정 , 등 측정 오류 또는 바람 돌풍 또는 기타.y^yy^X

이 개념에서, 당신은 y = 를 현실이 "해야 할"행동으로 취하고 있으며, 당신이 그것에 동의하지 않는 답변을 얻는다면, 현실은 잘못된 답변. 물론 이것은 이런 식으로 말하면 다소 어리 석고 거만 해 보일 수 있지만,이 개념을 진행하는 데에는 충분한 이유가 있으며, 이런 식으로 생각하는 것이 유용 할 수 있습니다. 그리고 궁극적으로 모델 일뿐입니다. 통계 학자들은 이것이 실제로 세상이 어떻게 작동하는지 반드시 생각하지는 않습니다 (아마도 누군가가있을 수도 있지만). 그리고 방정식 주어지면, 실제로는 마이너스가 예측됩니다.2xgy=y^+error

또한 두 번째 개념의 "실제로 잘못 이해"측면이 마음에 들지 않으면 "y가 의존하는 일부 프로세스 f를 식별 했지만 우리는 얻지 못하고 있습니다. "정답이 맞습니다. y에도 영향을주는 다른 프로세스가 있어야합니다." 이 변형에서X

y^=f(X)
y=y^+g(?)
g=yy^ 입니다.


4

@Aksakal의 답변은 완전히 정확하지만 내가 찾은 요소 하나를 추가하면됩니다 (그리고 내 학생들).

모토 : 통계는 "완벽하다". 에서와 같이, 나는 항상 완벽한 예측을 제공 할 수 있습니다 (나는 눈썹이 지금 당장 일어나고 있음을 알고 있습니다.

관찰 된 값 를 예측 . 어떤 형태의 모델을 사용하여 각 관측 값에 대해 예측 된 값을 생성하고이를 합니다. 유일한 문제는 일반적으로 (항상) 그래서 우리는 평등을 유지하기 위해 새로운 변수 추가 할 것입니다 ...하지만 더 나은 옵션은 그것을 추가하는 것 같습니다 실제 값에 더하거나 뺄 수없는 "예측 된"( "만들기") 값 (실제 값에서 더하거나 빼는 것은 물리적으로 불가능할 수 있으므로 ... 아래 주석 참조) : 이제 "완벽한"예측이 있습니다. "최종"값은 관찰 된 값과 일치합니다.yiy^i

yiy^i
ϵi
yi=y^i+ϵi

분명히, 이것은 무슨 일이 일어나고 있는지에 대한 통계 이론의 엄청난 양에 대해 광택이 있지만 ... 관찰 된 값은 두 개의 개별 부분 (체계적 부분과 임의 부분)의 합이라는 생각을 강조합니다. 이 형식으로 기억하면 항상 잔차 가 관측 값에서 예측값을 뺀 값이됩니다.ϵi


2
다른 방법으로 , 종종 잔차 또는 잔차 제곱의 절대 값으로 작업 할 때와 같이 부호를 포함하지 않는 계산에 관여하는 경우가 많습니다 ). y^iyi
Gregg H

6
왜 "예상 된 가치에 추가하는 것이 가장 좋은가"? 왜 "우리의 예측에 동의하기 위해 데이텀을 얼마나 조정해야합니까?" 두 방법 모두 다른 방법보다 더 명확하고 의미가 있거나 "직관적"이라고 주장하는 것 같지는 않습니다.
whuber

2
@whuber 한 항목은 "실제"(관찰, 구체적)이고 다른 항목은 (가설) 구성입니다. 무게를 기준으로 신장을 모델링하는 경우 실제 / 관측 높이를 일부 (가상) 예측 값과 일치시키기 위해 누군가를 3 인치로 "축소"하는 것이 합리적입니까?
Gregg H

2
예. 데이터에 대한 일반적인 사고 방식입니다. 나는 사람들이이 질문을 어떻게 인식하고 "최고"의 의미를 이해하는지에 대한 당신의 가정이 추측적이고 주관적 일 수 있다는 가능성을 지적하려고합니다.
whuber

공정 점 ... 간단한 코멘트와 함께 업데이트됩니다
그레그 H

2

최소 제곱 선형 회귀의 경우를 사용하겠습니다. 모델을 로 설정하면 @Aksakal이 지적했듯이 자연스럽게 끝나 므로 입니다. 대신 를 모델로 사용하면 됩니다. 이 시점에서 보다 대한 모호한 선호를 제외하고는 다른 것을 선호 할 이유가 없습니다 .Y=Xβ+εε=YXβε^=YY^Y=Xβεε=XβYε^=Y^Y11

그러나 이면 를 통해 잔차를 얻습니다 . 여기서 는 디자인 행렬 의 열 공간과 직교하는 공간으로 투영되는 행렬 입니다. 를 대신 사용하면 끝납니다 . 그러나 자체는 . 따라서 실제로 는 투영 행렬의 음수, 즉 입니다. 그래서 나는 이것을 사용하여 도입 된 부정적인 것을 취소하는 것으로 간주 하므로 parsimony를 위해 그냥 사용하는 것이 좋습니다ε^=YY^(IPX)YIPXXY=Xβεε^=(PXI)YPXIP X - I I - P X Y = X β - ε Y = X β + ε Y - Y(PXI)2=PX22PX+I=(PXI)PXIIPXY=XβεY=Xβ+ε 이는 잔차로 를 제공합니다.YY^

다른 곳에서 언급 한 바와 같이 우리가 사용하는 경우 아무것도 휴식 같은 아니라 ,하지만 난 그냥 사용하는 것이 충분한 이유가 생각이 이중 부정적인 상황으로 끝낼 .Y - YY^YYY^


그러나 아무것도 작성 특정 값의 표시와는 아무 상관이없는 더 쓰는 것보다, 것을 약속 또는 가정이다 또는 실제로 긍정적이다가. 같은 방정식 일 수 있지만 부호가 반대 인 있습니다. e y = β 0 + β 1 x β 0 β 1 e+eey=β0+β1xβ0β1e
Nick Cox

@NickCox는 귀하의 의견에 감사 드리며, 우리가 모델 을 작성하고 싶다는 가정에 대한 나의 대답을 전했다는 것을 알고 있습니다. 나는 이것을 해결하기 위해 그것을 다시 썼다Y=Xβ+ε
jld
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.