AR (1)을 사용한 랜덤 워크 추정

AR (1)을 사용하여 임의의 보행을 추정하면 계수는 1에 매우 가깝지만 항상 적습니다.

계수가 1보다 크지 않은 수학 이유는 무엇입니까?

regression autoregressive random-walk

— 마르코
소스

Matlab 도구 상자와 arima 스크립트를 사용해 보았습니다 (계수는 [-10,10]에 경계가 있고 결과는 같습니다). 간단한 OLS로 시도하고 결과는 동일합니다.

— Marco

추정치는 하향 조정되었으므로 Dickey와 Fuller 논문을 읽어야합니다.

— Marco

답변:

우리는 OLS에 의해 모델 추정합니다

x_{t} = ρ x_{t - 1} + u_{t}, E (u_{t} ∣ {x_{t - 1}, x_{t - 2}, . . .}) = 0, x_{0} = 0

$x_{t} = \rho x_{t-1} + u_t,\;\; E(u_t \mid \{x_{t-1}, x_{t-2},...\}) =0,\;x_0 =0$

크기가 T 인 표본의 경우 추정량은

\hat{ρ} = \frac{\sum_{t = 1}^{T} x_{t} x_{t - 1}}{\sum_{t = 1}^{T} x_{t - 1}^{2}} = ρ + \frac{\sum_{t = 1}^{T} u_{t} x_{t - 1}}{\sum_{t = 1}^{T} x_{t - 1}^{2}}

$\hat \rho = \frac {\sum_{t=1}^T x_{t}x_{t-1}}{\sum_{t=1}^T x_{t-1}^2} = \rho + \frac {\sum_{t=1}^T u_tx_{t-1}}{\sum_{t=1}^T x_{t-1}^2}$

$\rho=1$

x_{t} = x_{t - 1} + u_{t} ⟹ x_{t} = \sum_{i = 1}^{t} u_{i}

$x_{t} = x_{t-1} + u_t \implies x_t= \sum_{i=1}^t u_i$

$\hat \rho - 1$ $\approx 68$ $\approx$ $\hat \rho < 1$

여기에 이미지 설명을 입력하십시오

\begin{aligned} Mean: - 0.0017773 \\ Median: - 0.00085984 \\ Minimum: - 0.042875 \\ Maximum: 0.0052173 \\ Standard deviation: 0.0031625 \\ Skewness: - 2.2568 \\ Ex. kurtosis: 8.3017 \end{aligned}

$\begin{align} \text{Mean:} -0.0017773\\ \text{Median:} -0.00085984\\ \text{Minimum: } -0.042875\\ \text{Maximum: } 0.0052173\\ \text{Standard deviation: } 0.0031625\\ \text{Skewness: } -2.2568\\ \text{Ex. kurtosis: } 8.3017\\ \end{align}$

동일한 이름의 단위 루트 테스트를 수행하는 데 사용되는 임계 값의 기반이기 때문에 이것을 "Dickey-Fuller"분포라고도합니다.

샘플링 분포의 형태에 대한 직관 을 제공하려는 시도를 다시 생각하지 않습니다 . 우리는 랜덤 변수의 샘플링 분포를보고 있습니다

\hat{ρ} - 1 = (\sum_{t = 1}^{T} u_{t} x_{t - 1}) \cdot (\frac{1}{\sum_{t = 1}^{T} x_{t - 1}^{2}})

$\hat \rho - 1 = \left(\sum_{t=1}^T u_tx_{t-1}\right)\cdot \left(\frac {1}{\sum_{t=1}^T x_{t-1}^2}\right)$

$u_t$ $\hat \rho - 1$ $\hat \rho - 1$

$T=5$

독립적 인 제품 법선을 합하면 거의 0에 가까운 대칭 분포를 얻습니다. 예를 들면 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

그러나 우리의 경우와 같이 비 독립 제품 법선을 합하면

여기에 이미지 설명을 입력하십시오

오른쪽으로 치우 치지 만 음수 값에 더 많은 확률 질량이 할당됩니다. 그리고 표본 크기를 늘리고 더 많은 상관 요소를 합에 추가하면 질량이 왼쪽으로 훨씬 더 밀려납니다.

비 독립 감마의 합의 역수는 양의 스큐를 갖는 음이 아닌 랜덤 변수입니다.

$\hat \rho -1$

— 알레 코스 파파도풀로스
소스

와우, 좋은 분석! 여기에서 위반 한 표준 OLS 가정을 표시 할 수 있습니까?

— Richard Hardy

@RichardHardy 감사합니다. 귀하의 의견에 답변하기 위해 나중에 다시 방문하겠습니다.

— Alecos Papadopoulos 2016

나는 아직도 OLS 가정에 대해 궁금합니다. 미리 감사드립니다!

— Richard Hardy

X_{t + 1} = α X_{t} + ϵ

$X_{t+1} = \alpha X_t + \epsilon$

X_{t + 1} - X_{t}

$X_{t+1} - X_t$

\hat{ρ} < 1

$\hat \rho<1$

\hat{ρ} - 1

$\hat \rho-1$

이것은 실제로 답변이 아니지만 의견이 너무 길기 때문에 어쨌든 게시합니다.

100의 표본 크기 ( "R"사용)에 대해 백 개 중 1보다 2 배 큰 계수를 얻을 수있었습니다.

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

실현 84 및 95의 계수는 1보다 높 으므로 항상 1보다 낮지 는 않습니다 . 그러나 경향은 분명히 하향 편향 추정치를 갖는 것입니다. 질문이 남아 왜 ?

편집 : 위의 회귀에는 모형에 속하지 않은 절편 항이 포함되었습니다. 절편이 제거되면 1 (10000 중에서 3158) 이상으로 더 많은 추정값을 얻지 만 여전히 모든 경우의 50 % 미만입니다.

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

— 리차드 하디
소스

정확히, "항상"사소한 것이 아니라 대부분의 경우입니다. 분명히 가짜 결과입니다. 왜 그럴까요?

— Marco

x_{t}

$x_t$

x_{t - 1}

$x_{t-1}$