회귀 문제가“회귀”문제라고 불리는 이유는 무엇입니까?


답변:


34

"회귀"라는 용어는 그의 1886 년 논문 "유전자 키의 평범성에 대한 회귀"에서 Francis Galton에 의해 사용되었습니다. 내 지식으로는 그는 평균에 대한 회귀 의 맥락에서 그 용어를 사용했다 . 그런 다음이 용어는 오늘날 일반적인 통계 방법으로 사용되는 의미를 다소 얻기 위해 다른 사람들에 의해 채택되었습니다.


15
Galton은이 논문에서 아버지의 키로부터 아들의 키를 추정하기 위해 선형 근사법을 도출했습니다. 그의 방정식은 평균 신장 아버지가 평균 신장 아들을 갖도록 적합하지만, 평균 아버지보다 키가 큰 아들은 아버지보다 2/3 정도 키가 큰 아들을 갖습니다. 평균보다 짧습니다. 이것은 단순한 선형 회귀라고 할 수 있습니다 (오늘의 의미). 물론 오늘날의 회귀는 훨씬 더 넓은 의미를 갖습니다. 연속 예측을 만드는 모든 모델입니다. 그 단어의 원래 사용법이 얼마나 많이 바뀌 었는지 흥미 롭습니다.
rm999

3
NRH의 답변이 정확합니다. 다음 링크는 "유전 키에 평범 대한 회귀"프랜시스 갈톤의 논문에 대한 더 많은 정보를 제공 blog.minitab.com/blog/statistics-and-quality-data-analysis/...
Gaurav Singhal이

통계 커뮤니티가 '회귀'라는 단어를보다 간단하고 명확한 용어, 아마도 '공식 예측 자'로 대체해야 할 때입니까?
Aviad Rozenhek

4

진보와 반대로, 우리는 평균, 즉 회귀로 되돌아갑니다. 따라서 회귀라는 용어! 나는 그 물건이 집어 들고 붙어 있다고 생각합니다.


2

@Mark White는 이미 링크를 언급했지만 링크를 확인할 시간이없는 사용자를 위해 올바르게 참조 된 답변은 다음과 같습니다.

'회귀'의 기원

"회귀"라는 용어는 19 세기 프란시스 갈튼 (Francis Galton)에 의해 생물학적 현상을 설명하기 위해 만들어졌습니다. 이 현상은 키가 큰 조상의 후손의 키가 정상 평균 (평균에 대한 회귀라고도 알려진 현상)으로 내려가는 경향이 있었습니다 (Galton, reprinted 1989). Galton에게 회귀는 이러한 생물학적 의미만을 가졌지 만 (Galton, 1887) , 그의 연구는 나중에 Udny Yule과 Karl Pearson에 의해보다 일반적인 통계적 맥락으로 확장되었다 (Pearson, 1903).

참고 문헌

https://en.wikipedia.org/wiki/Regression_analysis#History

F. Galton (1877). 유전 법칙. III. 자연, 15 (389), 512-514.

Galton, F. (1989 년 재 인쇄). 친족 관계 통계 과학, 4 (2), 80–86.

피어슨, 케이 (1903). 조상의 유전 법. Biometrika, 2 (2), 211-228.


'평균에 대한 회귀'에서와 같이 Galton의 회귀는 의미가 있습니다. 그러나 '독립 변수에서 결과 변수로 공식 학습'을 의미하기 위해 '회귀'라는 단어의 사용을 이해하지 못합니다
Aviad Rozenhek

1
더 일반적으로 기계 학습은 회귀를 사용하지만 대중은 잘못된 의견에도 불구하고 기계 학습 기술이 아닙니다. 통계 학습은 머신 러닝과는 별개이지만 일반적으로 ML 제안자는 통계적 방법을 취하여이를 ML로 잘못 분류하여 명백한 불일치가 발생합니다. Galton의 회귀는 회귀입니다. 그것은 경향을 모델링 / 예측하는 것과 관련이 있습니다.
LSC

0

"회귀"는 라틴어 "회귀"에서 유래 한 "회귀"에서 비롯됩니다.

그런 의미에서 회귀는 지저분하고 해석하기 어려운 데이터에서보다 명확하고 의미있는 모델로 "돌아갈 수있는"기술입니다. 물리학 자로서, 나는 물리학 자들이 자연 현상을 비교적 단순한 자연 법칙의 여러 가능한 결과로보고 있기 때문에 아이디어를 좋아합니다.

다시 말해서, 회귀라는 단어는 데이터가 "통계 모델"의 가시적이고 실질적인 영향임을 시사하는 것 같습니다. 다시 말해, 모델이 먼저 나오고, 데이터를 사용하여 원래 데이터로 되돌아가는 것이 바람직합니다.


0

regression통계적 의미에서 단어는 한 변수의 평균 값과 다른 변수의 해당 값 사이의 관계를 측정하는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.