예측자가 직면 한 중요한 문제 중 하나는 주어진 시리즈 를 예측할 수 있는지 여부입니다.
필자 는 주어진 시계열을 결정하기 위해 대략적인 엔트로피 (ApEn) 를 상대적인 척도로 사용하는 Peter Catt의 " 우선 순위 예측 지표의 엔트로피 "라는 기사를 우연히 발견했습니다 .
기사는 말합니다
"작은 ApEn 값은 데이터 집합 뒤에 유사한 데이터 (규칙 성)가 올 확률이 높음을 나타냅니다. 반대로 ApEn 값이 클수록 유사한 데이터가 반복 될 가능성이 낮음을 나타냅니다 (불규칙성). , 무작위성 및 시스템 복잡성. "
그리고 ApEn을 계산하기위한 수학 공식이 이어집니다. 이는 상대적 의미에서 예측 가능성을 평가하는 데 사용할 수있는 수치를 제공하기 때문에 흥미로운 접근법입니다. 근사 엔트로피가 무엇을 의미하는지 모르겠습니다. 그것에 대해 더 많이 읽고 있습니다.
라는 패키지가 pracma 에 R
그건 당신이 ApEn을 계산할 수는. 설명을 위해 3 가지 시계열을 사용하고 ApEn 수를 계산했습니다.
- 시리즈 1 : 유명한 AirPassenger 시계열은 결정 론적이며 쉽게 예측할 수 있어야합니다.
- 시리즈 2 : Sunspot 시계열 – 정의가 잘되어 있지만 시리즈 1보다 예측하기 어려워 야합니다.
- 시리즈 3 : 난수이 시리즈 를 예측할 방법이 없습니다.
따라서 ApEn을 계산하면 Series 1은 Series 2보다 작아야하며 Series 3은 매우 작아야합니다.
다음은 세 시리즈 모두에 대한 ApEn을 계산하는 R 스 니펫입니다.
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
이것은 내가 기대 한 것이 아닙니다. 무작위 시리즈는 잘 정의 된 AirPassenger 시리즈보다 번호가 적습니다. 난수를 100으로 늘려도 잘 정의 된 시리즈 2 / Sunspot.yealry 시리즈보다 적은 다음을 얻습니다.
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
아래는 내 질문입니다 :
- ApEn (
m
및r
) 을 계산할 때 2 개의 매개 변수가 있습니까? 그들을 결정하는 방법.R
위 코드 에서 사용 된 기본값입니다 . - 내가 잘못하고있는 것은 ApEn이 sunspot.yearly와 같이 잘 정의 된 시리즈와 비교하여 임의의 숫자보다 낮다는 것을 잘못 보여줍니다.
- 시리즈의 계절을 줄이거 나 추론하고 ApEn을 추정해야합니다. 그러나 저자는 ApEn을 시리즈에 직접 적용했습니다.
- 시리즈가 예측 가능한지를 판단하는 다른 방법이 있습니까?