보간이란 무엇을 의미하며 회귀 개념과 어떤 관련이 있습니까?
보간은 표의 선 사이를 읽는 기술이며, 기초 수학에서이 용어는 일반적으로 해당 함수의 주어진 값 또는 테이블 값 세트에서 함수의 중간 값을 계산하는 프로세스를 나타냅니다.
나는 두 번째 질문에 대한 답을 줄 수 없습니다. 도와주세요
보간이란 무엇을 의미하며 회귀 개념과 어떤 관련이 있습니까?
보간은 표의 선 사이를 읽는 기술이며, 기초 수학에서이 용어는 일반적으로 해당 함수의 주어진 값 또는 테이블 값 세트에서 함수의 중간 값을 계산하는 프로세스를 나타냅니다.
나는 두 번째 질문에 대한 답을 줄 수 없습니다. 도와주세요
답변:
보간과 회귀의 주요 차이점은 그들이 해결하는 문제의 정의입니다.
데이터 점이 주어지면 보간 할 때 지정된대로 정확하게 해당 점에 값이있는 미리 정의 된 형태의 함수를 찾습니다. 즉, 주어진 쌍 ( x i , y i ) 은 F ( x i ) = y i 를 충족하는 미리 정의 된 형식의 F 를 찾습니다 . 가장 일반적으로 F 는 다항식, 스플라인 (주어진 점 사이의 간격에서 낮은 정도의 다항식)으로 선택됩니다.
회귀 분석을 수행 할 때 비용을 최소화하는 함수 (일반적으로 오차 제곱합)를 찾습니다. 주어진 지점에서 함수가 정확한 값을 가질 필요는 없으며 좋은 근접성을 원합니다. 일반적으로, 찾은 함수 는 모든 데이터 포인트에 대해 F ( x i ) = y i 를 만족하지 않을 수 있지만 비용 함수, 즉 ∑ n i = 1 ( F ( x i ) − y i ) 2 가 가장 작습니다. 주어진 형태의 모든 기능.
보간 대신에 단지 근사치 만 원할 수있는 좋은 예는 주식 시장의 가격입니다. 당신은 몇 가지의 가격이 걸릴 수 있습니다 시간의 최근 단위, 시간의 다음 단위 가격의 몇 가지 예측을 얻기 위해 그들을 보간하려고합니다. 가격 간의 관계가 다항식으로 정확하게 표현 될 수 있다고 생각할 이유가 없기 때문에 이것은 오히려 나쁜 생각입니다. 그러나 선형 회귀는 가격에 약간의 "기울기"가있을 수 있고 선형 함수는 적어도 로컬에서 좋은 근사치 일 수 있기 때문에 트릭을 수행 할 수 있습니다 (힌트 : 쉽지는 않지만 회귀는이 경우 보간보다 확실히 더 좋습니다. ).
이전의 두 답변은 선형 보간과 선형 회귀 (또는 일반 보간 및 다항 회귀) 사이의 관계를 설명했습니다. 그러나 중요한 연결은 회귀 모델에 적합하면 해당 모델을 사용하여 주어진 데이터 포인트 사이를 보간 할 수 있다는 것입니다.
바라건대 이것은 간단한 예제와 시각화와 함께 다소 빨리 올 것입니다.
다음과 같은 데이터가 있다고 가정하십시오.
X Y
1 6
10 15
20 25
30 35
40 45
50 55
회귀를 사용하여 X에 대한 응답으로 Y를 모형화 할 수 있습니다. R 사용 :
lm(y ~ x)
결과는 절편 5이며 x는 1입니다. 이는 주어진 X에 대해 임의의 Y를 X + 5로 계산할 수 있음을 의미합니다. 그림과 같이 다음과 같이 볼 수 있습니다.
X 축으로 가면서 어느 곳에서나 선을 적합 선까지 그린 다음 Y 축으로 선을 그리면 값 포인트를 제공했는지 여부에 관계없이 값을 얻을 수 있습니다. Y. 회귀는 기본 관계를 추정하여 데이터가없는 영역을 부드럽게합니다.
보간 및 회귀의 기본 차이는 다음과 같습니다. 보간 : 보간에서 n 개의 점 (예 : 10 개의 데이터 점)이 있다고 가정합니다. 모든 데이터 점을 통과 곡선을 을 a 회귀에서와 같이 다항식의 정도 (데이터 포인트 수 -1, 즉 여기서는 9 임). 모든 데이터 포인트가 곡선 피팅에 필요한 것은 아닙니다.
일반적으로 보간 및 회귀의 차수는 차수가 3보다 크면 (1,2 또는 3)이되고 곡선에서 더 많은 진동이 나타납니다.
회귀는 가장 적합한 선을 찾는 프로세스입니다 [1]. 보간은 사용중인 값이 데이터 범위 내에있는 경우 가장 적합한 선을 사용하여 한 변수의 값을 다른 변수의 값에서 추정하는 프로세스입니다. 범위를 벗어나면 외삽 [1]을 사용하게됩니다.
[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html
보간 또는 스플라인 피팅을 사용하면 더 큰 크기의 숫자 데이터 (각 원본 데이터 쌍에 보간 된 보간)가 플롯 될 때 부드러운 곡선의 효과를 생성합니다. 실제로, 각 원본 데이터 쌍 사이에 다른 다항식이 피팅되므로, 보간 후 전체 곡선은 조각 별 연속 곡선이며, 각 조각은 다른 다항식으로 구성됩니다.
원래 숫자 데이터의 파라 메트릭 표현을 찾으려면 회귀 분석을 수행해야합니다. 스플라인에 높은 다항식을 적용 할 수도 있습니다. 어쨌든 표현은 근사치입니다. 근사값이 얼마나 정확한지 확인할 수도 있습니다.
회귀와 보간은 다른 변수 (X)의 주어진 값에 대한 변수 (Y)의 값을 예측하는 데 사용됩니다. 회귀 분석에서는 표화 된 값의 범위를 벗어난 경우에도 주어진 독립 변수 (X)에 대한 종속 변수 (Y)의 모든 값을 예측할 수 있지만 보간의 경우 종속 변수의 값만 예측할 수 있습니다 (Y) 독립 변수 (X)의 값에 대해 주어진 X의 값 범위 내에 있습니다.
보간은 x = a와 x = b 사이의 여러 점을 보간 다항식에 정확하게 맞추는 과정입니다. 보간법을 사용하면 회귀 기법보다 정확도가 높은 도메인 x = [a, b]에서 y의 근사값 (또는 결 측값)을 찾을 수 있습니다.
반면에 회귀는 최소 제곱 오차로 점을 통과하거나 근처에있는 곡선에 여러 점을 맞추는 과정입니다. 회귀는 보간만큼 정확한 x = [a, b] 도메인의 y 값에 근사하지는 않지만 x = (-infinity, a)와 x = ( b, + 무한대).
In summary, interpolation provide better accuracy in the value of y within the domain of a known x range while regression provides better predictions of y in the domain below and beyond the known range of x.