선형 회귀 분석에서 순환 예측 변수 사용


19

바람 데이터 (0, 359)와 시간 (0, 23)을 사용하여 모델을 적합하려고하지만 선형 매개 변수가 아니기 때문에 선형 회귀에 적합하지 않을까 걱정됩니다. 파이썬을 사용하여 변환하고 싶습니다. 적어도 바람의 경우에는 그 정도의 죄와 코사인을 취함으로써 벡터 평균을 계산하는 것에 대한 언급이 있지만 전부는 아닙니다.

도움이 될만한 파이썬 라이브러리 또는 관련 방법이 있습니까?


1
질문 해 주셔서 감사합니다. 코드 또는 라이브러리를 요청하는 것은 주제에 맞지 않기 때문에 (질문의 대부분은 주제에 맞지 않습니다), 여기에서 답변이 다루어 질 수도 있고 다루지 않을 수도 있습니다.
gung-복직 모니카

여기서 응답 변수 (결과, 종속 변수)는 무엇입니까? 바람의 방향과 시간이 예측 자입니까?
Nick Cox

@NickCox 네, 풍향과 시간은 모두 예측 변수입니다. 결과는 입자 농도 (대기 오염)를 나타내는 정수 값입니다. 온도, 습도 등을 포함한 다른 예측 변수도 있지만 이러한 변환은 필요하지 않습니다.
compguy24

1
제목을 자유롭게 편집했습니다. 이전 제목 "원을 중심으로 한 도의 선형 분포"는 내 관점에서 전혀 문제를 포착하지 못했습니다.
Nick Cox

답변:


24

풍향 (여기서는 북쪽에서 시계 방향으로 나침반 방향으로 측정)은 원형 변수입니다. 시험은, 스케일의 종래의 시작은 끝과 동일한 지, 즉 인 . 예측 변수로 취급되는 경우 사인 및 코사인에 가장 잘 매핑 될 수 있습니다. 소프트웨어가 무엇이든 각도는 라디안 단위로 측정 될 것으로 예상되므로 변환은 다음과 같습니다.0=360

sin(π direction/180),cos(π direction/180)

2π=360

sin(π time/12),cos(π time/12)

또는

sin(π(time+0.5)/12),cos(π(time+0.5)/12)

정확히 시간이 어떻게 기록되었거나 해석되어야하는지에 따라.

때때로 자연이나 사회는 의무를 지니고 있으며 순환 변수에 대한 의존은 반응에 최적 인 어떤 방향의 방향을 취하고 반대 방향 (원의 절반)이 pessimal 인 형태를 취합니다. 이 경우 단일 사인 및 코사인 항으로 충분할 수 있습니다. 더 복잡한 패턴의 경우 다른 용어가 필요할 수 있습니다. 순환, 푸리에, 주기적, 삼각법 회귀에 대한이 기술에 대한 튜토리얼은 여기 에서 더 자세하게 참조 할 수 있습니다 . 좋은 소식은 사인과 코사인 항을 만든 후에는 회귀 분석에서 추가 예측 변수라는 것입니다.

순환 통계에 대한 많은 문헌이 있으며, 그 자체는 방향 통계의 일부로 간주됩니다. 이상하게도,이 기술은 문헌에서 일반적으로 순환 반응 변수에 초점을 맞추기 때문에 언급되지 않습니다. 벡터 변수로 순환 변수를 요약하는 것은 표준 설명 방법이지만 회귀에 필요하거나 직접 도움이되지는 않습니다.

용어에 대한 일부 세부 사항 바람 방향과 시간은 과학 분야의 용도에 관계없이 매개 변수가 아닌 통계 용어 변수입니다.

yXββX[1,1]

부수적 의견 입자 농도와 같은 반응 변수의 경우 긍정적 인 예측을 보장하기 위해 로그 링크가있는 일반화 된 선형 모델을 사용할 것으로 예상됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.