R에서 시계열의 평활도를 측정하는 방법은 무엇입니까?

R에서 시계열의 평활도를 측정하는 좋은 방법이 있습니까? 예를 들어

-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0

보다 매끄럽다

-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0

평균과 표준 편차는 동일하지만 시계열에서 부드러운 점수를주는 기능이 있으면 멋질 것입니다.

r time-series

— 아가 오
소스

매끄러움은 확률 적 프로세스 이론에서 잘 정의 된 의미를 갖습니다. ( "바로 그램은 통계적으로 통계적으로 양적이며 표면 거칠기에 대한 설명"입니다 : goldensoftware.com/variogramTutorial.pdf , p. 16) 매끄러움은 바로 그램을 0 거리까지 외삽 하는 것과 관련이 있습니다. (연속적인 차이의 SD와 1 차 자기 상관은 빠르고 더러운 버전입니다). 필수 정보는 테일러 계열의 계수에 0으로 포함됩니다. 예를 들어, 0이 아닌 상수는 실제로 거칠습니다. 0의 높은 차수 0은 매우 부드러운 계열을 나타냅니다.

— whuber

허스트 지수에 대해서도 들었 습니다.

— Taylor

얼마나 우스운 지, 나는이 똑같은 것을 스스로 궁금해했다. 게시 해 주셔서 감사합니다!

— Chris Beeley

@ whuber : 그것은 답변이 아니라 의견입니다.

— naught101

@ naught101 나는 겸손히달라고 간청한다. 내 의견은 관련 상황을 제안하는 것이며 공간 데이터를 모델링하는 데 사용되는 이론적 프로세스만을 의미하며, 실제로 그 평활도 를 어떻게 평가할 것인지가 아니다 . 다차원에서는 친숙하지만 (화살표 방향으로 인해) 특별한 것은 아닙니다. 따라서 다차원 절차를 시계열에 적용하는 것은 전혀 주저하지 않습니다. 기존 또는 심지어 좋은 접근 방식.

— whuber

답변:

차이의 표준 편차는 대략적인 평활도 추정치를 제공합니다.

x <- c(-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0)
y <- c(-1, 0.8, -0.6, 0.4, -0.2, 0, 0.2, -0.4, 0.6, -0.8, 1.0)
sd(diff(x))
sd(diff(y))

업데이트 : 청록이 지적했듯이, 그것은 규모에 따른 척도를 제공합니다. 비슷한 척도 독립적 척도는 표준 편차 대신 변동 계수를 사용합니다.

sd(diff(x))/abs(mean(diff(x)))
sd(diff(y))/abs(mean(diff(y)))

두 경우 모두 작은 값은 더 부드러운 계열에 해당합니다.

— 롭 헨 드먼
소스

이 점수는 규모가 변하지 않으므로 응용 프로그램에 따라 의미가 맞지 않을 수도 있습니다. (그리고 내 자신의 제안 은 규모가 변하지 않으므로 동일한 우려가 적용됩니다.) 또한 위의 점수에 대해 더 작은 값은 더 부드러운 시계열을 나타냅니다.

— Cyan

감사합니다 @Cyan. 스케일 독립 버전도 추가했습니다.

— Rob Hyndman

정말로 diff분모 에 포함 시키려고합니까? 값은 대수적 (x[n]-x[1])/(n-1)으로 추세의 (조악한) 척도로 줄어들며 많은 경우에 거의 0에 가까워져 불안정하고 의미있는 통계가 아닙니다. 나는 그것에 의아해하지만 어쩌면 나는 분명한 것을 간과하고 있습니다 ...

— whuber

나는 diff정상 성의 가정을 피하기 위해 사용 되었습니다. 분모로 정의 된 경우 abs(mean(x))스케일링 x은 정지 상태 에서만 작동 합니다. diff를 취하면 차이가있는 고정 프로세스에도 적용됩니다. 물론, diff는 x고정 되지 않을 수 있으며 여전히 문제가 있습니다. 이런 이유로 스케일링 시계열은 까다 롭습니다. 그러나 나는 당신의 안정성에 대해 지적합니다. 나는 더 나은 일을하기 위해서는 비모수 적 매끄럽게하는 것을 사용하여 훨씬 더 정교한 것을 요구할 것이라고 생각합니다.

— Rob Hyndman

나는 끊임없는 추세가 완벽하게 매끄러 워야한다고 생각했을 것입니다. 그래서 답은 0이어야합니다.

— Rob Hyndman

지연 1 자기 상관 은 점수의 역할을하며 통계적으로도 직관적으로 해석됩니다.

cor(x[-length(x)],x[-1])

점수 해석 :

1에 가까운 점수는 매끄럽게 변화하는 시리즈를 의미합니다
0에 가까운 점수는 데이터 포인트와 다음 포인트 사이에 전체 선형 관계가 없음을 의미합니다 (즉, plot (x [-length (x)], x [-1])은 명백한 선형성을 갖는 산점도를 나타내지 않습니다)
-1 근처의 점수는 시리즈가 특정 방식으로 들쭉날쭉하다는 것을 나타냅니다. 한 점이 평균보다 높으면 다음 점이 평균과 같은 양만큼 평균보다 낮을 가능성이 높습니다.

— 청록
소스

타임 스텝 번호와의 상관 관계를 확인할 수 있습니다. 이는 시계열에서 간단한 선형 회귀의 R²을 취하는 것과 같습니다. 그러나 그것들은 두 가지 매우 다른 시계열이므로 비교로 얼마나 잘 작동하는지 모르겠습니다.

— 못된 101
소스

그것은 시간에 따른 선형성의 척도이지만 매끄러움의 척도는 아닙니다.

— Rob Hyndman