회귀 분석과 곡선 피팅의 차이점


17

가능한 한 예를 들어 회귀 분석과 곡선 피팅 (선형 및 비선형)의 실제 차이점을 나에게 설명해 줄 수 있습니까?

두 변수 (종속 대 독립) 사이의 관계를 찾은 다음 제안되는 모델과 관련된 매개 변수 (또는 계수)를 결정하려고합니다. 예를 들어 다음과 같은 데이터 세트가있는 경우 :

Y = [1.000 1.000 1.000 0.961 0.884 0.000] 
X = [1.000 0.063 0.031 0.012 0.005 0.000]

아무도이 두 변수 사이의 상관 관계 공식을 제안 할 수 있습니까? 이 두 가지 방법의 차이점을 이해하는 데 어려움이 있습니다. 다른 데이터 세트로 답변을 지원하려는 경우 적합하지 않은 것 같습니다 (아마도 나에게만 해당).

위의 데이터 세트는 ROC ( 수신기 작동 특성 ) 곡선 의 y 축을 나타냅니다. 여기서 y 는 TPM ( 참 양수 )이고 x 는 FPR ( 거짓 양 )입니다.xyyx

특정 FPR에 대한 TPR을 추정하기 위해 이러한 점 중 아직 확실하지 않은 곡선에 맞추거나 원래의 질문에 따라 회귀 분석을 시도하고 있습니다 (또는 그 반대).

첫째, 두 개의 독립 변수 (TPR과 FPR) 사이에서 그러한 곡선 피팅 함수를 찾는 것이 과학적으로 수용 가능합니까?

둘째, 실제 음성과 실제 양성 사례의 분포가 정상이 아니라는 것을 알고 있다면 그러한 기능을 찾는 것이 과학적으로 수용 가능합니까?


1
불행히도 용어는 다른 사람들과 다른 상황에서 다르게 사용됩니다. 사람들이 서로 구별되는 예를 연결하거나 제공 할 수 있습니까?
gung-Monica Monica 복원

그것이 내가 알아 내려고하는 것, 그것들이 어떻게 다른지, 어떻게 구별 할 수 있는지입니다.
알리 술탄

1
충분히 공평하지만 누군가가 달라야한다고 말했습니까?
gung-모니 티 복원

2
이 사이트에서 일부 사람들은 회귀로 간주 할 수없는 의미에서 "곡선 피팅"을 사용했습니다. 예를 들어, 그들 중 일부는 밀도를 히스토그램에 대한 "곡선 피팅 (curve fitting)"의 형태로 추정한다고 생각합니다.
whuber

답변:


22

나는 통계 학적으로 생각되는 과학과 회귀곡선 적합 사이의 분야에서 명확하고 일관된 구별이 있는지 의심합니다 .

자격이없는 회귀는 선형 회귀 및 최소 제곱 추정을 의미합니다. 그것은 다른 또는 더 넓은 의미를 배제하지 않습니다. 실제로 일단 로짓, 포아송, 부정 이항 회귀 등을 허용하면 어떤 의미에서 회귀가 아닌 모델링이 있는지 알기가 더 어려워집니다.

커브 피팅은 문자 그대로 평면이나 최소한 저 차원 공간에서 그릴 수있는 커브를 제안합니다. 회귀는 그다지 제한되지 않으며 여러 차원 공간에서 표면을 예측할 수 있습니다.

커브 피팅은 선형 회귀 및 / 또는 최소 제곱을 사용하거나 사용하지 않을 수 있습니다. 다항식 (파워 시리즈) 또는 사인 및 코사인 항 집합을 피팅하거나 다른 방법으로 매개 변수에 함수형을 선형으로 맞추는 핵심 의미에서 실제로 선형 회귀로 자격을 부여 할 수 있습니다. 비선형 회귀 분석도 실제로 곡선 맞춤입니다.

커브 피팅이라는 용어는 비산, 경멸, 감가 상각 또는 무시하는 의미 ( "그냥 커브 피팅입니다!") 또는 (거의 완전한 반대)에서 사용될 수 있습니다. 또는 특정 물리적 (생물학적, 어떤 종류의 초기 또는 제한 행동 (예를 들어, 항상 긍정적이거나, 한 방향 또는 두 방향으로 제한됨, 모노톤, 굴곡, 단일 전환점, 진동 등)에 맞게 합리적이거나 합리적입니다.

여기서 몇 가지 퍼지 문제 중 하나는 동일한 기능적 형태가 어떤 상황에서는 최상으로 경험적이며 다른 상황에서는 훌륭한 이론이 될 수 있다는 것입니다. 뉴턴은 발사체의 궤도는 포물선 일 수 있으며, 2 차학에 의해 자연적으로 적합 할 수있는 반면, 사회 과학에서 연령 의존성에 적합하게 2 차는 종종 데이터의 곡률과 일치하는 퍼지 일 뿐이라고 가르쳤다. 지수 붕괴는 방사성 동위 원소에 대한 훌륭한 근사치이며, 중심으로부터 거리가 멀어지면 토지 가치가 하락하는 방식에 대한 때로는 그리 나쁜 추측은 아닙니다.

당신의 예는 나에게서 명백한 추측을 얻지 못합니다. 여기서 중요한 점은 매우 작은 데이터 집합을 가지고 있으며 변수가 무엇인지 또는 변수가 어떻게 작동 할 것인지에 대한 정보가 정확히 없다는 것은 모델 형식을 제안하는 것이 무책임하거나 어리석은 일입니다. 아마도 데이터가 (0, 0)에서 급격히 상승한 다음 (1, 1) 또는 다른 것으로 접근해야합니다. 당신은 우리에게 말해!

노트. 회귀 또는 곡선 적합도 단일 예측 변수 또는 단일 모수 (계수)로 제한되지 않습니다.


2
"곡선 맞춤 (Curve-fitting)"은 나에게 이론적 인 것을 의미한다 (예를 들어, lowess). 경제학자들은 때때로 이론적 인 함수 피팅을 '차트'로 정의하는데, 이는 일부 커브 피팅 사용법과 비슷하게 들립니다. 올바르게 이해하면 (예를 들어 lowess) 장단점이 있다고 생각합니다. 그러나 누군가가 문맥 상 더 분명한 용어를 어떻게 의미하는지 알기는 어렵습니다.
gung-복 직원 Monica

1
@ gung 나는 여러 자연 과학과 자연스럽지 않은 과학에 걸쳐 비슷한 부분적, 부분적 인 사용법이 있다고 생각합니다. 문제 중 하나는 충분한 매개 변수가 주어지면 반드시 많은 흔들림 공간이 있다는 것입니다. ARIMA뿐만 아니라 데이터가 제안하는 모든 위치에서 정현파 항과 단계, 램프 및 스파이크를 허용하는 시계열 모델을 생각 나게합니다.
Nick Cox

나는 두 번째 @gung, 커브 피팅은 적어도 나에게 더 비 파라 메트릭 의미를 가지고 있습니다.
Christoph Hanck

1
@ChristophHanck 여기에 "비모수 적"을 가져 오지 마십시오! 토론은 이미 진흙 투성이입니다!
Nick Cox

1
@gung : 스무딩 스플라인과 RKHS 방법을 일반적으로 "곡선 맞춤"의 중추로 생각하면 "곡선 맞춤"이 "회귀"보다 훨씬 이론적이라고 생각합니다. (이 답변에 대한 NickCox의 +1)
usεr11852는 Reinstate Monic이

8

@NickCox의 탁월한 답변 (+1) 외에도이 다소 희미한 용어 주제 에 대한 주관적인 인상을 나누고 싶었습니다 . 두 용어 사이의 미묘한 차이점은 다음과 같습니다. 한편으로, 회귀 는 항상 그렇지는 않지만 종종 분석 솔루션을 암시합니다 ( 회귀 자를 참조하는 것은 매개 변수를 결정 함을 의미 하므로 분석 솔루션에 대한 나의 주장). 반면, 곡선 피팅 은 반드시 분석 솔루션을 생성하는 것을 의미하지는 않으며 IMHO는 종종 탐색 적 접근 방식으로 사용될 수 있습니다 .


2
분석적인 솔루션이있는 것도 탐색적인 이유로 사용할 수 없습니까? 나는 당신이 반대하고 있다고 생각하지 않습니다.
amoeba는 Reinstate Monica가

@amoeba : 분석 솔루션은 물론 탐구 연구에도 사용될 수 있습니다. 그러나 내가하고있는 요점 은 문제의 용어 중 가장 널리 사용되는 본질 에 관한 것입니다.
Aleksandr Blekh
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.