R에서 시계열의 평활도를 측정하는 방법은 무엇입니까?


25

R에서 시계열의 평활도를 측정하는 좋은 방법이 있습니까? 예를 들어

-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0

보다 매끄럽다

-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0

평균과 표준 편차는 동일하지만 시계열에서 부드러운 점수를주는 기능이 있으면 멋질 것입니다.


4
매끄러움은 확률 적 프로세스 이론에서 잘 정의 된 의미를 갖습니다. ( "바로 그램은 통계적으로 통계적으로 양적이며 표면 거칠기에 대한 설명"입니다 : goldensoftware.com/variogramTutorial.pdf , p. 16) 매끄러움은 바로 그램을 0 거리까지 외삽 하는 것과 관련이 있습니다. (연속적인 차이의 SD와 1 차 자기 상관은 빠르고 더러운 버전입니다). 필수 정보는 테일러 계열의 계수에 0으로 포함됩니다. 예를 들어, 0이 아닌 상수는 실제로 거칠습니다. 0의 높은 차수 0은 매우 부드러운 계열을 나타냅니다.
whuber

허스트 지수에 대해서도 들었 습니다.
Taylor

얼마나 우스운 지, 나는이 똑같은 것을 스스로 궁금해했다. 게시 해 주셔서 감사합니다!
Chris Beeley

@ whuber : 그것은 답변이 아니라 의견입니다.
naught101

@ naught101 나는 겸손히달라고 간청한다. 내 의견은 관련 상황을 제안하는 것이며 공간 데이터를 모델링하는 데 사용되는 이론적 프로세스만을 의미하며, 실제로 그 평활도 를 어떻게 평가할 것인지가 아니다 . 다차원에서는 친숙하지만 (화살표 방향으로 인해) 특별한 것은 아닙니다. 따라서 다차원 절차를 시계열에 적용하는 것은 전혀 주저하지 않습니다. 기존 또는 심지어 좋은 접근 방식.
whuber

답변:


22

차이의 표준 편차는 대략적인 평활도 추정치를 제공합니다.

x <- c(-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0)
y <- c(-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0)
sd(diff(x))
sd(diff(y))

업데이트 : 청록이 지적했듯이, 그것은 규모에 따른 척도를 제공합니다. 비슷한 척도 독립적 척도는 표준 편차 대신 변동 계수를 사용합니다.

sd(diff(x))/abs(mean(diff(x)))
sd(diff(y))/abs(mean(diff(y)))

두 경우 모두 작은 값은 더 부드러운 계열에 해당합니다.


1
이 점수는 규모가 변하지 않으므로 응용 프로그램에 따라 의미가 맞지 않을 수도 있습니다. (그리고 내 자신의 제안 규모가 변하지 않으므로 동일한 우려가 적용됩니다.) 또한 위의 점수에 대해 더 작은 값은 더 부드러운 시계열을 나타냅니다.
Cyan

1
감사합니다 @Cyan. 스케일 독립 버전도 추가했습니다.
Rob Hyndman

2
정말로 diff분모 에 포함 시키려고합니까? 값은 대수적 (x[n]-x[1])/(n-1)으로 추세의 (조악한) 척도로 줄어들며 많은 경우에 거의 0에 가까워져 불안정하고 의미있는 통계가 아닙니다. 나는 그것에 의아해하지만 어쩌면 나는 분명한 것을 간과하고 있습니다 ...
whuber

1
나는 diff정상 성의 가정을 피하기 위해 사용 되었습니다. 분모로 정의 된 경우 abs(mean(x))스케일링 x은 정지 상태 에서만 작동 합니다. diff를 취하면 차이가있는 고정 프로세스에도 적용됩니다. 물론, diff는 x고정 되지 않을 수 있으며 여전히 문제가 있습니다. 이런 이유로 스케일링 시계열은 까다 롭습니다. 그러나 나는 당신의 안정성에 대해 지적합니다. 나는 더 나은 일을하기 위해서는 비모수 적 매끄럽게하는 것을 사용하여 훨씬 더 정교한 것을 요구할 것이라고 생각합니다.
Rob Hyndman

1
나는 끊임없는 추세가 완벽하게 매끄러 워야한다고 생각했을 것입니다. 그래서 답은 0이어야합니다.
Rob Hyndman

13

지연 1 자기 상관 은 점수의 역할을하며 통계적으로도 직관적으로 해석됩니다.

cor(x[-length(x)],x[-1])

점수 해석 :

  • 1에 가까운 점수는 매끄럽게 변화하는 시리즈를 의미합니다
  • 0에 가까운 점수는 데이터 포인트와 다음 포인트 사이에 전체 선형 관계가 없음을 의미합니다 (즉, plot (x [-length (x)], x [-1])은 명백한 선형성을 갖는 산점도를 나타내지 않습니다)
  • -1 근처의 점수는 시리즈가 특정 방식으로 들쭉날쭉하다는 것을 나타냅니다. 한 점이 평균보다 높으면 다음 점이 평균과 같은 양만큼 평균보다 낮을 가능성이 높습니다.

0

타임 스텝 번호와의 상관 관계를 확인할 수 있습니다. 이는 시계열에서 간단한 선형 회귀의 R²을 취하는 것과 같습니다. 그러나 그것들은 두 가지 매우 다른 시계열이므로 비교로 얼마나 잘 작동하는지 모르겠습니다.


4
그것은 시간에 따른 선형성의 척도이지만 매끄러움의 척도는 아닙니다.
Rob Hyndman
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.