한 번 봐 가지고 무거운 꼬리 램버트 W를 F를 X 또는 램버트 W는 F의 X 왜곡 분포 시도를 (면책 조항 : 나는 저자입니다). R에서는 LambertW 패키지 로 구현 됩니다.
관련 게시물:
와이엑스
다음은 주식 펀드 수익률에 적용된 Lambert W x Gaussian 추정치의 예입니다.
library(fEcofin)
ret <- ts(equityFunds[, -1] * 100)
plot(ret)
수익의 요약 측정 항목은 OP의 게시물과 비슷합니다 (극단하지는 않음).
data_metrics <- function(x) {
c(mean = mean(x), sd = sd(x), min = min(x), max = max(x),
skewness = skewness(x), kurtosis = kurtosis(x))
}
ret.metrics <- t(apply(ret, 2, data_metrics))
ret.metrics
## mean sd min max skewness kurtosis
## EASTEU 0.1300 1.538 -18.42 12.38 -1.855 28.95
## LATAM 0.1206 1.468 -6.06 5.66 -0.434 4.21
## CHINA 0.0864 0.911 -4.71 4.27 -0.322 5.42
## INDIA 0.1515 1.502 -12.72 14.05 -0.505 15.22
## ENERGY 0.0997 1.187 -5.00 5.02 -0.271 4.48
## MINING 0.1315 1.394 -7.72 5.69 -0.692 5.64
## GOLD 0.1098 1.855 -10.14 6.99 -0.350 5.11
## WATER 0.0628 0.748 -5.07 3.72 -0.405 6.08
대부분의 시리즈는 비정상적인 특성을 나타냅니다 (왜곡 및 / 또는 큰 첨도). 모멘트 추정기 ( IGMM
) 방법을 사용하여 두꺼운 꼬리 Lambert W x 가우스 분포 (= Tukey 's h)를 사용하여 각 계열을 가우스 화합니다 .
library(LambertW)
ret.gauss <- Gaussianize(ret, type = "h", method = "IGMM")
colnames(ret.gauss) <- gsub(".X", "", colnames(ret.gauss))
plot(ts(ret.gauss))
시계열 도표는 꼬리가 훨씬 적고 시간이 지남에 따라 더 안정적인 변화를 보여줍니다 (일관되지는 않음). 가우시안 화 된 시계열에서 메트릭을 다시 계산하면 다음과 같은 결과가 나타납니다.
ret.gauss.metrics <- t(apply(ret.gauss, 2, data_metrics))
ret.gauss.metrics
## mean sd min max skewness kurtosis
## EASTEU 0.1663 0.962 -3.50 3.46 -0.193 3
## LATAM 0.1371 1.279 -3.91 3.93 -0.253 3
## CHINA 0.0933 0.734 -2.32 2.36 -0.102 3
## INDIA 0.1819 1.002 -3.35 3.78 -0.193 3
## ENERGY 0.1088 1.006 -3.03 3.18 -0.144 3
## MINING 0.1610 1.109 -3.55 3.34 -0.298 3
## GOLD 0.1241 1.537 -5.15 4.48 -0.123 3
## WATER 0.0704 0.607 -2.17 2.02 -0.157 3
IGMM
삼Gaussianize()
scale()
단순 이변 량 회귀
아르 자형이자형S티이자형유, t아르 자형나는엔D IA , t
layout(matrix(1:2, ncol = 2, byrow = TRUE))
plot(ret[, "INDIA"], ret[, "EASTEU"])
grid()
plot(ret.gauss[, "INDIA"], ret.gauss[, "EASTEU"])
grid()
원래 시리즈의 왼쪽 산점도는 강한 특이 치가 같은 날에 발생하지 않았지만 인도와 유럽에서는 다른 시간에 발생했음을 보여줍니다. 그 외에는 센터의 데이터 클라우드가 상관 관계 또는 부정적 / 긍정적 종속성을 지원하지 않는지 확실하지 않습니다. 특이 치가 분산 및 상관 추정치에 큰 영향을 미치기 때문에 두꺼운 꼬리가 제거 된 의존성을 살펴 보는 것이 좋습니다 (오른쪽 산점도). 여기에서 패턴이 훨씬 명확 해지고 인도와 동유럽 시장 사이의 긍정적 관계가 분명해집니다.
# try these models on your own
mod <- lm(EASTEU ~ INDIA * CHINA, data = ret)
mod.robust <- rlm(EASTEU ~ INDIA, data = ret)
mod.gauss <- lm(EASTEU ~ INDIA, data = ret.gauss)
summary(mod)
summary(mod.robust)
summary(mod.gauss)
그레인저 인과성
VA R ( 5 )p = 5
library(vars)
mod.vars <- vars::VAR(ret[, c("EASTEU", "INDIA")], p = 5)
causality(mod.vars, "INDIA")$Granger
##
## Granger causality H0: INDIA do not Granger-cause EASTEU
##
## data: VAR object mod.vars
## F-Test = 3, df1 = 5, df2 = 3000, p-value = 0.02
causality(mod.vars, "EASTEU")$Granger
##
## Granger causality H0: EASTEU do not Granger-cause INDIA
##
## data: VAR object mod.vars
## F-Test = 4, df1 = 5, df2 = 3000, p-value = 0.003
그러나 가우시안 화 된 데이터의 경우 답이 다릅니다! 다음 테스트는 할 수 없다 "인도는 않습니다 H0을 거부 하지 EASTEU 그랜저 원인"하지만, 여전히 "EASTEU하지 인도 그랜저-유발하는"것을 거부합니다. 가우시안 화 된 데이터는 다음 날 유럽 시장이 인도 시장을 주도한다는 가설을 뒷받침합니다.
mod.vars.gauss <- vars::VAR(ret.gauss[, c("EASTEU", "INDIA")], p = 5)
causality(mod.vars.gauss, "INDIA")$Granger
##
## Granger causality H0: INDIA do not Granger-cause EASTEU
##
## data: VAR object mod.vars.gauss
## F-Test = 0.8, df1 = 5, df2 = 3000, p-value = 0.5
causality(mod.vars.gauss, "EASTEU")$Granger
##
## Granger causality H0: EASTEU do not Granger-cause INDIA
##
## data: VAR object mod.vars.gauss
## F-Test = 2, df1 = 5, df2 = 3000, p-value = 0.06
VA R ( 5 )