선형 회귀 모형에주기 성분을 추가하는 방법은 무엇입니까?


17

누적 빈도 데이터가 있습니다. 선 은 데이터에 매우 잘 맞는 것처럼 보이지만 선에 주기적 / 주기적 흔들림이 있습니다. 누적 빈도가 특정 값 c에 도달하는 시점을 추정하고 싶습니다 . 잔차 대 적합치 값을 플롯하면 아름다운 정현파 동작이 나타납니다.y=ax+bc

이제 다른 합병증을 추가하려면 잔차 그림에서

대체 텍스트

다른 것보다 값이 낮은 두 사이클이 있으며, 이는 주말 효과도 고려해야합니다.

그래서 여기서 어디로 가야합니까? 코사인, 사인 또는 순환 항을 회귀 모델로 결합하는 방법은 다음과 같습니다. 누적 빈도가 같을 때의 추정치 ?

답변:


9

멋진 stl()방법을 시도해 볼 수 있습니다. 반복 loess()피팅을 사용하여 추세와 계절 및 나머지로 분해 합니다. 여기에서 진동이 발생할 수 있습니다.


8

진동의 주파수를 알고 있다면 sin (2π wt)과 cos (2π wt)라는 두 개의 추가 예측 변수를 포함 할 수 있습니다. 원하는 파장을 얻기 위해 w를 설정하면 진동이 모델링됩니다. 진폭과 위상 각에 맞게 두 항이 모두 필요합니다. 주파수가 둘 이상인 경우 각 주파수에 대해 사인 및 코사인 항이 필요합니다.

주파수가 무엇인지 모르는 경우 여러 주파수를 분리하는 표준 방법은 데이터를 추론하고 (이전에 수행 한 선형 선형에서 잔차를 얻음) 잔차에 대해 이산 푸리에 변환을 실행하는 것입니다. 데이터 분석 추가 기능에 푸리에 분석 도구가있는 MS-Excel을 사용하는 빠르고 더러운 방법입니다. 잔차에 대해 분석을 실행하고 변환의 절대 값을 가져와 결과를 막대 그래프로 표시합니다. 피크는 모델링하려는 주요 주파수 구성 요소가됩니다.

이 순환 예측 변수를 추가 할 때 회귀 분석에서 p- 값에주의를 기울이고 과적 합하지 마십시오. 통계적으로 중요한 주파수 만 사용하십시오. 불행히도, 이것은 저주파수를 맞추는 것을 조금 어렵게 만들 수 있습니다.


2
푸리에 분석에서와 같이 데이터에서 빈도를 추정 한 다음 회귀 분석에 sin / cos 항으로 포함하면 p- 값이 의미가 없습니다.
whuber

4

이 데이터에 적합한 최소 자승법이 부적절하다는 것을 관찰하면서 시작합시다. 축적되는 개인 데이터를 가정하는 경우, 평소와 같이, 임의 오차 성분을 가지고, 다음 누적 데이터에 오류가 ( 하지 누적 주파수 당신이 가진 것보다 --that의 뭔가 다른)는 모든 오류 용어의 누적 합계입니다. 이것은 누적 데이터를 이분법 적으로 (시간이 지남에 따라 점점 더 가변적이 됨) 강하게 양의 상관 관계로 만듭니다. 이러한 데이터는 규칙적으로 동작하고 데이터가 너무 많기 때문에 적합에 문제가 거의 없습니다. 그러나 오류 추정치, 예측 (질문과 관련된 모든 것), 특히 표준 예측 오차를 얻을 수 있습니다.

이러한 데이터를 분석하는 표준 절차는 원래 값으로 시작합니다. 고주파 정현파 성분을 제거하려면 일상적인 차이를 취하십시오. 일주일주기를 제거하기 위해 차이점을 주 단위로 가져 가십시오. 남은 것을 분석하십시오. ARIMA 모델링은 강력하고 유연한 접근 방식이지만 간단하게 시작합니다. 차이가있는 데이터를 그래프로 표시하여 진행 상황을 확인한 다음 계속 진행합니다. 또한 2 주 미만의 데이터를 사용하면 주간주기의 추정치가 낮아지고이 불확실성이 예측의 불확실성을 지배하게됩니다.


2

분명히 지배적 인 진동은 하루 동안의 기간이 있습니다. 요일과 관련된 저주파 구성 요소도있는 것처럼 보이므로 1 주일 (즉, 1/7) 주파수와 처음 몇 개의 고조파를 갖는 구성 요소를 추가하십시오. 그것은 다음과 같은 형식의 모델을 제공합니다.

E(y)=c+a0cos(2πt)+b0sin(2πt)+a1cos(2πt/7)+b1sin(2πt/7)+a2cos(4πt/7)+b2sin(4πt/7)+

ty


-2

왜 GA를 사용하여 사인 (또는 코사인) 시리즈의 진폭,주기 및 위상을 순차적으로 찾은 다음 결합하지 않겠습니까? 다음을 최적화하십시오 : (n (n-1) / ((np-1) ^ 2 (np-2))) RSS


1
이것이 역 누적 주파수 함수 계산에 대한 질문에 어떻게 대답하는지 확실하지 않습니다. 그리고 "GA"는 무엇을 의미합니까? 유전자 알고리즘? 다른 것?
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.