플롯이 단일 회귀 분석으로 예측 된 간단한 회귀를 도입하기 위해 보편적으로 사용되는 이유는 이해를 돕기 때문입니다.
그러나 나는 무슨 일이 일어나고 있는지 이해하는 데 도움이 될 수있는 맛을 줄 수 있다고 생각합니다. 이 부분에서 나는 주로 그들이 이해 한 것을 전달하려고 노력하는데, 이것은 회귀에 관해 읽을 때 일반적으로 겪게 될 다른 측면들에 도움이 될 수 있습니다. 따라서이 답변은 주로 게시물의 특정 측면을 처리합니다.
평범한 사무실 책상과 같은 큰 직사각형 테이블 앞에 앉아 있고, 하나는 팔 전체 길이 (약 1.8 미터), 너비의 절반 정도가 될 것입니다.
한 쪽 긴면의 중간 위치에서 테이블 앞에 앉습니다. 이 테이블에서 (매우 매끄러운 헤드가있는) 많은 손톱이 상단 표면에 찔려서 조금씩 찌르도록합니다 (그곳을 느낄 정도로 충분하고 끈을 묶거나 고무 밴드를 부착하기에 충분합니다) ).
이 손톱은 한쪽 끝 (예 : 왼쪽 끝)을 향해 일반적으로 책상의 가장자리에 더 가깝고 다른 쪽 끝을 향해 갈 때 손톱 머리와 같은 방식으로 책상 가장자리에서 다양한 거리에 있습니다. 가장자리에서 멀리 떨어져있는 경향이 있습니다.
또한 가장자리를 따라 어떤 위치에서 손톱이 가장자리에서 얼마나 멀리 떨어져 있는지를 이해하는 것이 유용 할 것이라고 상상해보십시오.
책상의 가장자리를 따라 어떤 장소를 선택하고 손을 거기에 놓은 다음 테이블을 가로 질러 곧장 앞으로 손을 부드럽게 몸쪽으로 드래그 한 다음 다시 멀리 떨어 뜨려 손톱 머리 위로 손을 앞뒤로 움직입니다. 이 손톱에서 수십 개의 충돌이 발생합니다. 손의 좁은 너비 (손이 책상에서 왼쪽 끝에서 일정한 거리를두고 가장자리에서 직접 이동함에 따라), 약 10cm 너비의 단면 또는 스트립 .
아이디어는 작은 부분에서 책상 가장자리에서 못까지의 평균 거리를 계산하는 것입니다. 직관적으로 그것은 우리가 맞은 범프의 중간 일뿐입니다. 책상의 너비 부분에서 손톱까지의 각 거리를 측정하면 그 평균을 쉽게 계산할 수 있습니다.
예를 들어, 머리가 책상의 가장자리를 따라 미끄러지고 샤프트가 책상의 반대쪽을 향하지만 책상 바로 위를 향하는 T- 스퀘어 를 사용할 수 있습니다. 또는 오른쪽-주어진 손톱을 지나갈 때 T-square의 샤프트를 따라 거리를 얻을 수 있습니다.
따라서 우리의 가장자리를 따라 진행되는 과정에서 우리는 손 너비 스트립에서 모든 손톱을 찾아 우리를 향해 멀어지고 평균 거리를 찾는 운동을 반복합니다. 아마도 우리는 책상을 가장자리를 따라 손 너비 스트립으로 나눕니다 (따라서 모든 손톱은 정확히 하나의 스트립으로 만납니다).
이제 21 개의 스트립이 있는데, 첫 번째는 왼쪽 가장자리에 있고 마지막은 오른쪽 가장자리에 있습니다. 우리가 스트립을 가로 질러 진행함에 따라 수단은 책상 가장자리에서 멀어집니다.
이 평균은 x (왼쪽 끝에서 가장자리를 따라 떨어진 거리), 즉 E (y | x)에 대한 y (거리)에 대한 간단한 비모수 회귀 추정량을 형성합니다. 특히, 이것은 비제 한 비모수 회귀 추정기이며, 회귀도라고도합니다.
만약 그 스트립 평균이 규칙적으로 증가했다면, 즉 평균이 스트립을 가로 질러 움직일 때와 거의 같은 스트립 당 양만큼 증가했다면, y의 기대 값이 선형이라고 가정함으로써 회귀 함수를 더 잘 추정 할 수 있습니다 x의 함수-즉 x에 주어진 y의 예상 값은 상수에 x의 배수를 더한 것입니다. 여기서 상수는 x가 0 일 때 손톱이있는 위치를 나타냅니다 (종종 가장 왼쪽 가장자리에 배치 할 수도 있지만 반드시 그럴 필요는 없음). x의 특정 배수는 평균의 평균 속도가 얼마나 빠른가 오른쪽으로 1 센티미터 씩 움직일 때
그러나 그러한 선형 함수를 찾는 방법은 무엇입니까?
우리가 각 손톱 머리 위에 하나의 고무 밴드를 고리로 묶어 책상 위에, 손톱 위에 놓인 길고 얇은 막대기에 각각 붙인다 고 상상해보십시오. 각 스트립의 "중간"근처에 에 대한.
우리는 밴드가 우리를 향한 방향으로 만 (왼쪽 또는 오른쪽이 아닌) 방향으로 만 뻗는 방식으로 밴드를 부착합니다-왼쪽으로 자신의 왼쪽으로 잡아 당겨 스틱과 직각으로 스트레칭 방향을 만듭니다. 그러나 여기서는 스트레치 방향이 책상 가장자리를 향하거나 멀어지는 방향으로 만 유지되도록 방지합니다. 이제 우리는 밴드가 각 손톱쪽으로 잡아 당기면서 스틱을 고정시킵니다. 더 먼 손톱 (더 뻗은 고무 밴드가있는)은 스틱에 가까운 손톱보다 그에 상응하여 세게 당깁니다.
이어서, 스틱을 당기는 모든 밴드의 결합 된 결과는 (적어도, 적어도) 신장 된 고무 밴드의 제곱 길이의 합을 최소화하기 위해 스틱을 잡아 당기는 것이고; 주어진 x 위치에서 테이블의 가장자리에서 스틱까지의 거리는 테이블을 가로 질러 해당 방향으로 x가 주어진 y의 예상 값에 대한 추정치입니다.
이것은 본질적으로 선형 회귀 추정치입니다.
이제 손톱 대신 큰 나무에 매달린 많은 과일 (작은 사과와 같은)이 있고 땅 위의 위치에 따라 과일의 평균 거리를 찾으려고합니다. 이 경우 우리가 앞으로 나아갈수록지면 위의 높이가 점점 커지고 오른쪽으로 움직일 때 약간 더 커지므로 규칙적인 방식으로 다시 앞으로 올라갈 때마다 각 단계마다 평균 높이가 거의 같은 양으로 바뀌고 각 단계는 right는 또한 대략 일정한 양만큼 평균을 변화시킬 것입니다 (그러나이 stepping-right 평균 변화량은 step-forward 변화량과 다릅니다).
우리가 앞으로 나아가거나 오른쪽으로 갈 때 평균 높이가 어떻게 변하는 지 알아 내기 위해 과일에서 얇은 평평한 시트 (아마도 딱딱한 플라스틱의 얇은 시트)까지의 수직 거리의 제곱의 합계를 최소화하면, 두 개의 예측 변수가있는 선형 회귀-다중 회귀
이것들은 음모가 이해하는 데 도움이 될 수있는 유일한 두 가지 경우입니다 (방금 설명한 내용을 빨리 보여줄 수는 있지만 동일한 아이디어를 개념화 할 수있는 근거가 있음을 희망합니다). 가장 간단한 두 가지 경우를 넘어서서, 우리는 수학 만 남았습니다.
이제 주택 가격을 예로 들어 보자. 책상의 가장자리를 따라 거리를두고 모든 집의 면적을 나타낼 수 있습니다-가장 큰 집 크기는 오른쪽 가장자리 근처의 위치로 나타내며, 다른 모든 집 크기는 특정 센티미터 수를 나타내는 왼쪽의 일부 위치입니다. 평방 미터의 수. 이제 거리는 판매 가격을 나타냅니다. 가장 비싼 집을 책상의 가장 먼 가장자리 (항상 의자에서 가장 먼 가장자리) 근처에서 특정 거리로 지정하면, 이동 한 모든 센티미터가 몇 개의 Rial을 나타냅니다.
현재 우리는 책상의 왼쪽 모서리가 0의 주택 면적에 해당하고 가까운 모서리가 0의 주택 가격에 해당하도록 표현을 선택했다고 가정합니다. 그런 다음 각 주택에 못을 박습니다.
우리는 아마도 가장자리의 왼쪽 끝 근처에 손톱이 없을 것입니다 (그들은 주로 오른쪽을 향하고 멀리 우리를 향할 수도 있습니다). 이것은 반드시 스케일의 좋은 선택은 아니지만 절편이없는 모델의 선택으로 인해 그것을 논의하는 더 좋은 방법.
이제 모델에서 책상 근처 가장자리의 왼쪽 모서리에있는 막대 모양의 끈을 통과하도록 스틱을 강제 적용합니다. 따라서 장착 된 모델의 면적이 0 인 경우 자연스럽게 보일 수 있습니다. 모든 판매에 영향을 미치는 상당히 일정한 가격 요소. 그런 다음 절편을 0과 다르게하는 것이 합리적입니다.
어쨌든, 루프를 추가하면 이전과 동일한 고무 밴드 운동이 선의 최소 제곱 추정치를 찾습니다.