시계열은 확률 과정과 동일합니까?


27

확률 과정은 시간이 지남에 따라 진화하는 과정이므로 실제로 "시계열"이라고 말하는 더 환상적인 방법입니까?


10
시계열은 불연속 시간 관찰을 지원하는 확률 적 프로세스입니다. 확률 적 프로세스는 연속적으로 관찰 될 수 있습니다. (이 시리즈는 랜덤 오브젝트 뒤에있는 관측 및 확률 적 프로세스와 더 관련이있을 수도 있습니다.)
Xi'an

"시리즈"는 잠재적으로 "프로세스"의 연속적인 성격과 달리 불연속 적이거나 유한 한 성질을 의미합니다.
Aksakal

7
확률 론적 프로세스는 시간이 지남에 따라 진화 할 필요가 없다 . 고정 될 수 있습니다. 내 생각에 확률 론적 프로세스와 시계열의 차이점은 관점 중 하나입니다. 확률 적 프로세스는 랜덤 변수의 모음이며 시계열은 숫자의 모음 이거나 확률 적 프로세스의 실현 또는 샘플 경로 입니다. 프로세스에 대한 추가 가정을 통해 프로세스 등을 포함하는 모든 랜덤 변수의 공통 밀도 (또는 질량 함수)의 추정치로 시계열 숫자 히스토그램 을 사용할 수 있습니다 .
Dilip Sarwate

2
@DilipSarwate, 시계열은 고정되어있을 수 있습니다.
Aksakal

2
@ Aksakal 나는달라고 간청합니다. 통계학자가 유한 길이 시계열 을 관측했다고 가정 해 봅시다 . 그것이 (또는 아닌) 어떻게 알 수 있습니까? 우리가 확률 론적 과정 에 대해 추론 할 수있는 몇 가지 시계열 (동시 순간)을 이용할 수 없다면 ( "Gee, 에 의해 취해진 값의 히스토그램 은 의 선택에 관계없이 거의 동일하다 ") . 그러나 일련의 숫자? 시리즈가 정지인지 아닌지를 말할 수는 없지만 기본 확률 적 프로세스 모델을 가정 할 수 있습니다.
1,0,1,0,1,0,1
N엑스
Dilip Sarwate

답변:


32

의견과 답변에 많은 불일치가 나타나기 때문에 일부 당국을 참조하십시오.

제임스 해밀턴도 시계열을 정의하지는 않지만 시계열이 무엇인지 분명합니다.

...이 숫자 세트 는 데이터를 생성 한 기본 확률 적 프로세스의 가능한 결과 중 하나 일뿐입니다. 실제로 프로세스가 무한정 진행되었다고 상상하더라도 시퀀스에 도달하면 무한 시퀀스 것 여전히 시계열 프로세스에서 단일 실현으로 간주됩니다. ...{ y t } t = = { , y - 1 , y 0 , y 1 , y 2 , , y T , y T + 1 , y T + 2 , , } , { y t } t =

{와이}=={,와이1,와이0,와이1,와이2,,와이,와이+1,와이+2,,},
{와이}=

의 전지를 상상해 컴퓨터 시퀀스를 생성 ... 각 날짜 에서 날짜 와 관련된 관측치를 선택하는 것이 순서 : 이것은 랜덤 변수 의 구현 샘플로 설명됩니다 . ...{ Y ( 1 ) t } t = - , { Y ( 2 ) t } t = - , ... , { Y ( I ) t } t = - t { Y ( 1 ) t , Y ( 2 ) t , , y ( I )나는{와이(1)}=, {와이(2)}=,, {와이(나는)}=나는Yt

{와이(1),와이(2),,와이(나는)}.
나는와이

( 시계열 분석 , 3 장)

따라서 "시계열 프로세스"는 정수 인덱스 된 무작위 변수 의 집합입니다 .{와이}

에서 확률 미분 방정식, 인 Bernt Øksendal는 일반적인 확률 과정의 표준 수학적 정의를 제공합니다 :

정의 2.1.4. 확률 과정은 표화 랜덤 변수들의 집합 인 확률 공간 정의 과의 값을 가정 .

{엑스}
(Ω,에프,) 아르 자형

매개 변수 공간 는 일반적으로 (이 책에서와 같이) 반선 이지만 간격 , 음이 아닌 정수 및 하위 집합 일 수도 있습니다. 경우 입니다.[0,)[에이,]아르 자형1

이 두 가지를 종합하면 시계열 프로세스가 정수로 인덱스 된 확률 적 프로세스 라는 것을 알 수 있습니다.

어떤 사람들은 "시계열"을 사용하여 시계열 과정 의 실현 을 언급합니다 ( Wikipedia 기사 에서와 같이 ). 우리는 "시계열 프로세스"를 사용하여 프로세스를 실현과 구별하려는 합리적인 노력을 해밀턴의 언어에서 볼 수 있으므로 "시계열"을 사용하여 실현 (또는 데이터)을 나타낼 수 있습니다.


2
(+1) 마지막 단락이 특히 중요하다고 생각합니다 (미묘하지만). 그러나 "연속 시계열"이라는 아이디어가 때때로 나타나는 것을 덧붙이고 싶었다. 간혹이 문구는 변수 자체가 불연속이 아니라 연속적임을 나타 내기 위해 사용되는 경우도 있지만, 시간이 연속적으로 샘플링되고 있음을 나타내는 데 사용되기도했습니다 . 따라서 "정수로 색인화"는 보편적으로 허용되는 정의가 아닐 수도 있습니다. 예를 참조하십시오 여기 시계열 내부 : 이론 및 방법을 Brockwell & 데이비스.
Silverfish

1
@ Silverfish 의견을 보내 주셔서 감사합니다. 궁극적으로, 나는 "시리즈"가 수학에서 보편적으로 사용되어 계산 가능한 도메인 을 가진 함수를 언급한다는 단순한 이유 때문에 설득력이 없습니다 . "계속 샘플링 됨"은 해당 개념에 포함될 수 없습니다. 나는 일부 저자들이 연속적인 확률 론적 과정을 "시리즈"라고 언급했을지도 모른다는 당신의 관찰에 도전하지 않는다. 나는 이것이 사실이라면, 잘 확립 된 용어를 남용하고 있다고 말하는 것이다.
whuber

3
나는 이것에 대해 "설명 대 처방전"논쟁의 정도가 있다고 생각합니다. "연속 시계열"의 개념은 분명히 소수 사용입니다 (이것이 현장에 의존하는지 궁금합니다. 신호 처리 사람들이 일반적으로 "시리즈"가 아니라 "연속 시간 신호"를 참조 할 것이라는 나의 이해는 제한적입니다)) 그리고 개인적으로 저는 '시리즈'라는 단어가 논리적으로 이산 샘플링과 더 일치한다는 데 동의합니다. 나는 단지 소수의 사용량이 전문가들조차도 들어 본 적이 없다는 것을 지적하고 싶었다.
Silverfish

@Silverfish, 따라서 연속 시계열도 고려하는이 ​​소수의 경우 확률 과정은 시계열과 동일합니까?
코드 교황

3

확률 적 프로세스는 임의의 변수 (반드시 독립적 일 필요 는 없음)의 집합 또는 집합입니다 . 여기서 색인 t는 특정 집합의 값을 가져 ,이 집합은 순서가 정해져 있습니다. 무작위 도보 예. 시계열 확률 론적 과정의 실현입니다.{엑스}


1

확률 적 프로세스 정의

(Ω,에프,)에스아르 자형

  • Ω에스
    • 엑스
    • ωΩ엑스(ω)엑스

시계열 정의

확률 론적 과정은 명백하고 수학적인 정의를 가지고 있습니다. 시계열은 덜 정확한 개념이며 사람들은 시계열을 사용하여 두 가지 관련이 있지만 다른 개체를 나타냅니다.

  1. WHuber가 설명했듯이 정수 (예 : 월별 데이터)로 매핑 될 수있는 정수 또는 일정한 증분 시간 단위로 인덱스 된 확률 적 프로세스입니다.
  2. 정기적으로 관찰되는 데이터 모음. 이것은 정수로 색인화 된 확률 론적 프로세스의 실현 일 수 있습니다. 때때로 이것을 시계열 데이터라고합니다.

예 : 압정의 두 번 뒤집기

Ω={ωHH,ωH,ωH,ω}엑스1,엑스2

엑스1(ω)={1:ω{ωHH,ωH}0:ω{ωH,ω}

엑스2(ω)={1:ω{ωHH,ωH}0:ω{ωH,ω}

{엑스1,엑스2}엑스엑스(ωHH)=(H,H)


0

확률 적 프로세스와 시계열의 차이점은 키보드의 고양이와 스택 교환의 답변의 차이와 다소 비슷합니다. 키보드의 고양이는 답을 얻을 수 있지만 키보드의 고양이 이 아닙니다 . 또한 모든 답변이 키보드의 고양이에 의해 생성되는 것은 아닙니다.

시계열은 시간-값-데이터-포인트 쌍의 모음으로 이해 될 수 있습니다. 반면에 확률 론적 과정은 시계열 ¹의 수학적 모델 또는 수학적 설명입니다. 어떤 시계열은 확률 적 프로세스의 실현입니다 (어느 종류이든). 또는 다른 관점에서 : 확률 적 프로세스를 모델로 사용하여 시계열을 생성 할 수 있습니다.

또한 다른 방법으로 시계열을 생성 할 수도 있습니다.

  • 그것들은 관찰의 결과가 될 수 있으며 현실에 의해 생성됩니다. 현실을 확률 적 과정으로 모델링 할 수 있지만 (실제를 확률 적 과정으로 간주한다고 말할 수도 있지만) 현실 상자 내부가 일련의 포인트가 아닌 것과 같은 방식으로 확률 적 과정이 아닙니다. 모델링 컨텍스트에서 두 가지를 고려하십시오).

  • 엑스=2


¹ 이산 시간 확률 적 프로세스 인 경우. 연속 시간 확률 적 프로세스는 시계열이 아닌 함수의 분포입니다.


1
모델과 데이터 집합을 구분하는지 또는 다른 점을 만들려고하는지 확실하지 않습니다. 또한 확률 론적 프로세스가 무엇인지 명확하지 않습니다. (당신이 말한 것은 그것이 "고르지 않은" "이산적인 확률 론적 과정"이라는 것입니다.) 당신의 박람회에서 이러한 불확실성은 혼란을 해결하기보다는 혼란에 가중시킬 수 있습니다.
whuber

@ whuber : 몇 가지 측면을 명확히하기 위해 내 대답을 편집했지만 "짝수"문장도 잘못 이해했다고 생각합니다.
Wrzlprmft

0

시계열 대 확률 론적 주제에 관한 모든 토론 / 의견에 감사드립니다. 차이점에 대한 나의 이해는 다음과 같습니다. 시계열은 관찰 된 시간과 함께 색인화 된 일련의 숫자로 기록 된 현상입니다. 뉴욕 증권 거래소의 주가와 같은 실제 현상에 대한 일련의 관측 일 가능성이 높습니다. 반면에 확률 론적 과정은 시계열의 수학적 표현 (생산이 아님)으로 항상 이해됩니다.


확률 과정은 시계열보다 더 일반적입니다. 예를 들어 Markov 체인은 시계열이 아닌 확률 적 프로세스입니다.
Michael R. Chernick

1
@Michael Chernick : Markov Chain은 다음과 같은 정의와 일치하지 않습니다. 이러한 정의 중 Markov Chains 중 어느 부분이 이러한 정의를 만족하지 않거나 동의하지 않습니까?
ColorStatistics
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.