두 개의 상관 랜덤 변수를 샘플링하는 기술은 무엇입니까?


16

두 개의 상관 랜덤 변수를 샘플링하는 몇 가지 기술은 무엇입니까?

  • 확률 분포가 매개 변수화 된 경우 (예 : 로그 정규)

  • 비모수 분포가있는 경우

데이터는 0이 아닌 상관 계수를 계산할 수있는 두 개의 시계열입니다. 우리는 과거의 상관 관계와 시계열 CDF가 일정하다고 가정하여 미래에 이러한 데이터를 시뮬레이션하고 싶습니다.

사례 (2)의 경우, 1 차원 유사체는 CDF를 구성하고 그로부터 표본을 추출하는 것입니다. 그래서 저는 2-D CDF를 구성하고 같은 일을 할 수 있다고 생각합니다. 그러나 개별 1D CDF를 사용하고 어떻게 든 선택을 연결하여 접근 할 수 있는지 궁금합니다.

감사!


3
1D CDF를 연결하면 copula를 생각하게 됩니다. 그들이 당신에게 사용되는지 확실하지 않습니다.
onestop

답변:


23

나는 당신이 찾고있는 것이 copula라고 생각합니다. 두 개의 한계 분포 (모수 또는 경험적 cdfs로 지정)가 생겼으며 이제 둘 사이의 종속성을 지정하려고합니다. 이변 량 사례의 경우 모든 종류의 선택이 있지만 기본 레시피는 동일합니다. 해석을 쉽게하기 위해 가우스 copula를 사용하겠습니다.

상관 행렬 C 를 사용하여 가우스 copula에서 그리려면C

  1. 추첨 (Z=(Z1,Z2)N(0,C)

  2. i = 1 , 2에 대해 를 설정합니다 ( Φ 를 표준 정규 cdf로). 이제 U 1 , U 2U [ 0 , 1 ] 이지만 종속적입니다.Ui=Φ(Zi)i=1,2ΦU1,U2U[0,1]

  3. 집합 여기서, F - 1 변수 한계 CDF의 (의사) 역이다 I . 이것은 Y i 가 원하는 분포를 따른다는 것을 의미합니다 (이 단계는 단지 역변환 샘플링입니다).Yi=Fi1(Ui)Fi1iYi

짜잔! 간단한 경우에 사용 해보고 한계 히스토그램과 산점도를 살펴보십시오. 재미 있습니다.

그래도 이것이 특정 응용 프로그램에 적합하다는 보장은 없습니다 (특히, 가우시안 copula를 copula로 교체해야 할 수도 있음). 그러나 이것은 시작해야합니다. copula 모델링에 대한 좋은 참고 자료는 Nelsen (1999), Copulas에 대한 소개 이지만 온라인에서도 꽤 좋은 소개가 있습니다.


2
+1 Nelsen은 읽을 수 있습니다. 몇 년 전에 많은 온라인 자료를 검토 한 후에도 사본을 구입했습니다.
whuber

1
훌륭한 튜토리얼과 함께 제공되는 스프레드 시트를 찾았습니다 : behan.ws/copula.pdf and soa.org/files/xls/rsrch-copula-ex.xls
Pete

1
@Pete, 종이는 참으로 좋습니다. 반면 스프레드 시트 링크는 죽었습니다
Boris Gorelik

최신 버전의 Mathematica와 Matlab에 이미 이러한 문제를 처리하는 내장 함수가있는 것 같습니다.
LCFactorization

소총 copula와 동일하게하려면 어떻게해야합니까? 정상과 옆구리 사이에 관계가 있습니까?
fedvasu

2

또 다른 대중적인 방법은 샘플링하는 "삼 변량 감소"입니다 엑스1와이+엑스2+ 랜덤 변량에 의해 상관이 유도되도록 . 이는 2 차원 이상으로 일반화 할 수 있지만 2 차원 경우보다 더 복잡합니다. 긍정적 인 상관 관계 만 얻을 수 있다고 생각할 수도 있지만 실제로는 다음을 사용하여 부정적인 상관 관계를 얻을 수도 있습니다.(1) 랜덤 변량을 생성 할 때 분포에 음의 상관 관계가 유도됩니다.

세 번째로 인기있는 방법은 (NORTA) NORmal To Anything입니다 . 상관 된 정규 변량을 생성하고, 각각의 cdfs를 평가하여 균일 한 변량 변이로 만든 다음,이 "새로운"균일 변량 변량을 새로운 분포에서 추첨을 생성 할 때 임의의 원천으로 사용합니다.

다른 게시물에서 언급 한 copula (전체 클래스의 방법) 접근법 외에도 copula 접근법과 정신적으로 유사한 최대 커플 링 분포에서 샘플링 할 수도 있습니다. 한계 분포와 최대 결합에서 표본을 지정합니다. 피에르 야곱에 의해 설명 된 바와 같이이 2 동의를 거부 단계로 수행됩니다 여기에 . 아마도이 방법은 2보다 높은 차원으로 확장 될 수 있지만 달성하기가 더 복잡 할 수 있습니다. 최대 커플 링이 marginals의 매개 변수의 값을 볼 수에 따라 상관 관계를 유도 않습니다 내 질문에 대한 시안의 대답이의 좋은 예를 들어 게시물을.

대략적인 (대부분의 경우) 표본을 기꺼이 받아들이려면 MCMC 기법 도 다차원 분포에서 표본을 추출하는 옵션입니다.

또한 수락 거부 방법을 사용할 수 있지만 일반적으로 샘플링 할 지배 밀도를 찾아서 원하는 밀도에 대한 비율을 평가하는 것은 어렵습니다.

이것은 내가 생각할 수있는 모든 추가 방법이지만 아마도 내가 놓친 부부가있을 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.