선형 회귀 분석에서 선형은 무엇을 의미합니까?


11

R에서 쓰면

lm(a ~ b + c + b*c) 

이것은 여전히 ​​선형 회귀입니까?

R에서 다른 종류의 회귀를 수행하는 방법은 무엇입니까? 교과서 나 튜토리얼에 대한 추천을 부탁드립니다.


나는 당신의 질문에 약간의 단어를 바꾸려고 노력했습니다. 두 가지 매우 다른 질문을하는 것 같습니다. 두 번째 사이트에서는이 사이트뿐만 아니라 CRAN 에서도 많은 리소스를 사용할 수 있습니다 .
chl

@chl, 그래, 고마워, 나는 명확하지 않았다. 내 질문은 실제로 이것입니다 : 만약 내가 R로 LM을 쓰면 R은 그것을 선형으로 이해하거나 반드시 어떤 모델에도 맞추려고 시도합니까, 반드시 선형 회귀가 아니라 회귀입니까?
suprvisr

아니요, lm()선형 회귀를 나타냅니다. 귀하의 모델은 세 가지 매개 변수 (마이너스 절편)을 포함 b, c및 상호 작용 b:c을 의미, b + c + b:c또는 b*c(R은 통계 모델에 대한 윌킨슨의 표기법을 따른다) 짧게합니다. 일반화 선형 모형 피팅 (즉, 위에 표시된 선형 모형의 경우와 같이 링크 함수가 동일하지 않은 경우)을 통해 요청합니다 glm().
chl

답변:


24

선형은 추정하는 모수 (예 : )와 결과 (예 : y i ) 사이의 관계를 나타냅니다 . 따라서 y = e x β + ϵ 는 선형이지만 y = e β x + ϵ 는 선형 이 아닙니다. 사용자의 파라미터 벡터의 추정하여 기록 할 수있는 선형 모델 수단 β = Σ를 I w I Y I , 여기서 { w I }β와이나는와이=이자형엑스β+ϵ와이=이자형β엑스+ϵβ^=나는나는와이나는{나는}추정 절차에 의해 결정된 가중치입니다. 선형 모델은 대수적으로 닫힌 형태로 해결 될 수있는 반면, 많은 비선형 모델은 컴퓨터를 사용하여 수치를 최대화하여 해결해야합니다.


6
+1 특히, "선형 모델"에서 종속 변수 매개 변수 의 선형 함수 이지만 반드시 데이터는 아닙니다. 와이
whuber

첫 번째는 선형입니까? 정말로-x의 거듭 제곱?
Suprvisr

2
그렇습니다. 는 관심 수량 (최적화되는 수량)이 아니라 β 이기 때문입니다. 따라서, 그것은 β 에서 선형이다 . 엑스ββ
bayerj

+1이지만 질문의 수식에 댓글을 달면이 답변을 개선 할 수 있습니다.
naught101

1
두 번째로 읽은 후이 회신의 후반부가 "선형 모델"과 "선형 추정기"를 혼동한다는 것을 알았습니다. 두 가지 개념은 서로 다르며 다릅니다. 비선형 모델에는 종종 선형 추정기가 있고 선형 모델에는 비선형 추정기가있을 수 있습니다 (예 : GLM 고려).
whuber

5

minitab.com 의이 게시물은 매우 명확한 설명을 제공합니다.

  • 이 형식으로 쓸 수있는 모델은 선형입니다.
    • Response = constant + parameter * predictor + ... + parameter * predictor
      • (모델)에서 각 용어는 상수 또는 어느 경우 즉, 제품 파라미터와 예측 변수.
    • 따라서 둘 다 선형 모델입니다.
      • (이것은 직선입니다)와이=0+1엑스1
      • (이것은 곡선입니다)와이=0+1엑스12
  • 위 형식을 사용하여 모형 표현할 수 없으면 비선형입니다.
    • 비선형 모델의 예 :
      • X B 1 1와이=0+엑스11
      • 와이=0코사인(1엑스1)

4

나는 이것을 "선형 회귀"질문과 "선형 회귀"질문으로 요구할 때주의해야한다. R의 수식에는 알고 있거나 알지 못하는 규칙이 있습니다. 예를 들면 다음과 같습니다.

http://wiener.math.csi.cuny.edu/st/stRmanual/ModelFormula.html

다음 방정식이 선형인지 묻는다고 가정합니다.

a = coeff0 + (coeff1 * b) + (coeff2 * c) + (coeff3 * (b*c))

다음과 같은 새로운 독립 변수를 어셈블하면 대답은 '예'입니다.

newv = b * c

위의 newv 방정식을 원래 방정식으로 대체하면 아마도 선형 방정식에 대해 기대하는 것과 같습니다

a = coeff0 + (coeff1 * b) + (coeff2 * c) + (coeff3 * newv)

참고로, 구글 "회귀 분석", 또는 당신이 생각하는 모든 것이 당신에게 도움이 될 것입니다.


무언가의 이름을 바꾸면 어떻게 선형화됩니까? newv = b * c라는 아이덴티티가 있으면 선형 적이 지 않다는 것을 이해하지 못합니다. 혼란 스러워요.
bayerj

@bayer : newv는 새로운 변수입니다. 새로운 방정식은 계수가 선형 관계를 제공하는 세 가지 변수 (b, c, newv)의 선형 함수입니다. 두 방정식 모두 두 변수의 선형 조합이 아닙니다.
bill_080

@bayer @Charlie의 답변보기 본 예에서, 모델 모두 a4 개의 계수의 선형 함수 이기 때문에 모델 모두 선형이다 (R은 그렇게하는지 여부와 상관없이) .
whuber

고맙습니다, 말이됩니다 ... 데이터베이스 (의료)의 각 경우에 대해 b * c 인 새로운 변수 neww를 추가 한 다음 선형 회귀로 취급 할 수 있습니까?
suprvisr

2

선형 회귀를 (선형) 행렬 방정식으로 쓸 수 있습니다.

[1245...]=[1111222244445555...]×[ααα]+[ϵ1ϵ2ϵϵ4ϵ5...ϵ]

또는 이것을 접 으면 :

=α+α+α+ϵ


와이=이자형+이자형와이=(이자형(V)+이자형(V))


나는 이것이 단지 무엇 대신에 왜 질문에 대답하기 때문에 이것이 최선의 대답이라고 생각합니다. "무엇"으로 응답해도 직관력이 향상되지 않습니다.
Hexatonic
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.