일반적으로, 나는 넓고 다른 질문을함으로써 시작하는 것이 과학적으로나 통계적으로 더 유익하다고 생각합니다. 즉, 순환 예측 변수로부터 반응을 얼마나 멀리 예측할 수 있는지입니다. 나는 방향이 아니라 여기에 원형 이라고 말합니다 . 부분적으로는 구형이고 훨씬 더 멋진 공간을 포함하기 때문에 단일 답변으로 모두 다룰 수는 없습니다. 그리고 부분적으로 당신의 예, 시간 과 시간 이 모두 순환하기 때문입니다. 또 다른 주요 예는 나침반 방향 (바람, 동물 또는 인간의 움직임, 정렬 등)과 관련이 있으며, 이는 많은 순환 문제에서 특징이 있습니다.
때마다 사용하여, 그것은 멀리 얻을 수 있습니다 회귀 모형의 어떤 종류 시간의 사인 및 코사인 함수를 간단한을하고 쉽게 모델링 방법을 구현합니다. 많은 생물학적 및 / 또는 환경 적 예를 요구하는 첫 번째 포트입니다. (계절을 나타내는 생물 현상은 일반적으로 기후 나 날씨에 직간접 적으로 반응하기 때문에 두 종류는 종종 혼동됩니다.)
구체적으로 24 시간 또는 12 개월에 걸친 시간 측정을 상상해보십시오.
sin[2π(hour/24)], cos[2π(hour/24)]
sin[2π(month/12)], cos[2π(month/12)]
각각 하루 또는 연도의 한주기를 나타냅니다. 측정 된 또는 카운트 된 응답과 순환 시간 사이의 관계가없는 공식 테스트는 사인 및 코사인의 계수가 예측 변수 인 사인 및 코사인, 적절한 링크 및 패밀리를 갖는 일반 선형 모형에서 공동 제로인지 여부에 대한 표준 테스트입니다. 응답의 특성에 따라 선택됩니다.
응답의 한계 분포 (정상 또는 기타)에 대한 문제는이 접근법에서 부차적이거나 가족 선택에 의해 처리되어야합니다.
사인과 코사인의 장점은 당연히 주기적이며 자동으로 둘러싸 기 때문에 매일 또는 연도의 시작과 끝의 값은 반드시 하나이며 동일합니다. 경계가 없기 때문에 경계 조건에 문제가 없습니다.
이 접근법을 순환, 주기적, 삼각법 및 푸리에 회귀라고합니다. 하나의 입문 자습서 검토는 여기를 참조 하십시오.
실제로,
이러한 테스트는 일반적으로 계절성을 기대할 때마다 기존 수준에서 압도적으로 중요한 결과를 보여줍니다. 더 흥미로운 질문은 정확한 계절 곡선과 다른 정현파 항을 가진 더 복잡한 모형이 필요한지 여부입니다.
다른 예측 변수를 배제하는 것은 없습니다.이 경우 계절 예측을위한 사인 및 코사인, 다른 모든 예측 변수를 포함한 다른 예측 변수가 포함 된보다 포괄적 인 모델이 필요합니다.
어떤 시점에서 연구원의 데이터, 문제 및 취향과 경험에 따라 문제의 시계열 측면을 강조하고 명시적인 시간 의존성을 가진 모델을 만드는 것이 더 자연스러워 질 수 있습니다. 실제로, 일부 통계에 관심이있는 사람들은 다른 방법으로 접근 할 수 없다고 거부 할 것입니다.
추세 라고 쉽게 명명되는 (그러나 항상 쉽게 식별 할 수있는 것은 아님) # 2 또는 # 3 또는 둘 다에 해당됩니다.
시장, 국가 및 국제 경제 또는 기타 인간 현상의 계절 성과 관련이있는 많은 경제학자 및 기타 사회 과학자들은 일반적으로 매일 또는 (보다 일반적으로) 매년 더 복잡한 변동 가능성에 더 깊은 인상을받습니다. 항상은 아니지만, 계절성은 프로젝트의 주요 초점조차도 계절성을 흥미롭고 중요하게 생각하는 생물학적 및 환경 과학자와 달리, 제거하거나 조정해야 할 성가신 경우가 많습니다. 즉, 경제학자와 다른 사람들도 종종 회귀 유형 접근법을 채택하지만 탄약을 사용 하면 지표 (더미) 변수 묶음, 가장 간단하게 매월 또는 매년 4 분기마다 변수 묶음0,1. 이것은 공휴일, 휴가 기간, 학년도의 부작용 등의 영향뿐만 아니라 기후 또는 날씨 기원의 영향 또는 충격을 포착하려는 실질적인 방법입니다. 이러한 차이점을 언급하면서 위의 의견 대부분은 경제 및 사회 과학에도 적용됩니다.
이환율, 사망률, 병원 입원, 진료소 방문 등의 변화에 관심이있는 역학자 및 의료 통계학 자의 태도와 접근은이 두 극단 사이에 빠지는 경향이 있습니다.
필자의 견해로는 며칠 또는 몇 년을 반으로 나누면 대개 임의적이며 인공적이며 가장 어색합니다. 또한 데이터에 일반적으로 존재하는 매끄러운 구조의 종류를 무시합니다.
편집 지금까지의 계정은 불연속 시간과 연속 시간의 차이를 다루지 않지만 실제로는 큰 경험으로 생각하지 않습니다.
그러나 정확한 선택은 데이터가 도착하는 방식과 변경 패턴에 따라 다릅니다.
데이터가 분기 별이고 사람이라면 지표 변수를 사용하는 경향이 있습니다 (예 : 분기 3과 4는 종종 다름). 매월 그리고 인간이라면 선택의 여지가 분명하지 않지만 대부분의 경제학자에게 죄와 코사인을 팔기 위해 열심히 노력해야 할 것입니다. 매월 또는 세밀하고 생물학적 또는 환경 적이라면 분명히 죄와 코사인.
편집 2 삼각 회귀에 대한 자세한 내용
삼각법 회귀 분석의 특징적인 세부 사항 (원하는 경우 다른 방법으로 명명 됨)은 거의 항상 사인과 코사인 항이 쌍으로 모델에 가장 잘 표현된다는 것입니다. 우리는 먼저 시간, 연도 또는 나침반 방향을 스케일링하여 원의 각도
로 라디안으로 표시되므로 간격 됩니다. 그런 다음 모델에 필요한만큼 쌍의 를 사용합니다. (원형 통계에서 삼각법은 통계적 규칙을 능가하는 경향이 있으므로, 와 같은 그리스어 기호 는 변수뿐만 아니라 변수에도 사용됩니다.)θ[0,2π]sinkθ,coskθ,k=1,2,3,…θ,ϕ,ψ
우리가 같은 예측 한 쌍을 제공하는 경우 회귀 모델처럼, 우리는이 계수 추정치, 말 즉, 모델의 용어를, . 이것은 주기적 신호의 진폭뿐만 아니라 위상을 맞추는 방법입니다. 그렇지 않으면 와 같은 함수를 다음과 같이 다시 쓸 수 있습니다.sinθ,cosθb1,b2b1sinθ,b2cosθsin(θ+ϕ)
sinθcosϕ+cosθsinϕ,
그러나 위상을 나타내는 및 는 모형 피팅에서 추정됩니다. 그렇게하면 비선형 추정 문제를 피할 수 있습니다.sin ϕcosϕsinϕ
우리가 사용하는 경우 떨어져 순환 변동, 자동으로 최대 그 곡선의 최소 모델입니다 반 원. 그것은 종종 생물학적 또는 환경 적 변화에 대한 매우 근사치이지만, 특히 경제 계절을 포착하려면 몇 가지 용어가 더 필요할 수 있습니다. 이는 지표 변수를 대신 사용하는 매우 좋은 이유 일 수 있으며, 이는 계수의 간단한 해석으로 즉시 이어집니다.b1sinθ+b2cosθ