PCA는 자동 상관 데이터로 무엇을하고 있습니까?


9

일부 통신원이 자기 상관 계산 방법에 관해 흥미로운 의문을 제기했기 때문에 시계열과 자기 상관에 대한 지식이 거의없이이를 다루기 시작했습니다.

통신원은 자신의 데이터를 정리했습니다 (32 시계열의 데이터 포인트)를 제외하고 각각 한 시간 지연 씩 이동하여 32×32 첫 번째 행이 원래 데이터이고 두 번째 행이 데이터를 이동 한 데이터 (내가 이해 한 것처럼) 1시간 단위, 다른 행에 의한 다음 행 등. 끝 부분을 꼬리에 붙임으로써 "원형"데이터 세트를 만들어서이를 추가로 실현했습니다.

그런 다음 무엇이 나올지 알아보기 위해 상관 행렬을 계산하고이 주요 구성 요소를 사용했습니다. 놀랍게도 나는 주파수 분해의 이미지를 얻었고 (다른 데이터와 함께) 하나의 주파수를 보았습니다.32 데이터는 첫 번째 주요 구성 요소에 있었고 두 번째 기간에는 두 번째 PC에 있었으며 6 고유 값을 가진 "관련된"PC >1). 먼저 이것이 입력 데이터에 달려 있다고 생각했지만 이제는 순환 이동 ( "Toeplitz"매트릭스라고도 함)을 사용하여 데이터 세트를 특수하게 구성하여 체계적으로이 방식으로 가정합니다. varimax 또는 다른 회전 기준에 대한 PC- 솔루션의 회전은 약간 다른, 아마도 흥미로운 결과를 제공했지만 일반적으로 그러한 주파수 분해를 제공하는 것으로 보입니다.

여기에 대한 링크입니다 내가 만든 한 사진 으로부터는32포인트 데이터 세트; 곡선은 단순히 factormatrix의 하중으로 만들어집니다. 하나는 하나의 요인에 대한 하중입니다. 첫 번째 PC1의 곡선은 가장 높은 진폭을 보여 주어야합니다 (대략 최대 적재량의 제곱을 갖기 때문에)

질문 :

  • Q1 : 의도적으로 설계된 기능입니까? (이 유형의 데이터 세트를 가진 PCA의)
  • Q2 : 주파수 / 파장 분석에 대한 진지한 접근에이 방법이 실제로 사용 가능한가?

[업데이트] 여기에 데이터 세트가 있습니다 (복사 가능함).

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3

@amoeba와 많은 편집에 감사드립니다. 나중에 편집하려는 두 가지 오류 만 보았습니다. 질문이 훨씬 멋지게 보입니다!
Gottfried Helms

답변:


4

이전 의견을 답변으로 변환하겠습니다.

데이터 행렬의 행이 변수 또는 샘플이라고 상상하십니까? 나는 그것들이 샘플이라고 가정 할 것이다.n=32 다른 시계열 (샘플).

그렇다면 모두 n=32 행은 동일하지만 원형으로 만 이동합니다. 1 각각을 위치시킨 다음 n×n모든 행 쌍 사이의 내적으로 구성된 데이터의 그램 행렬은 Toeplitz 구조를 갖습니다. 대각선에 가까울수록 높은 값은 0에서 멀어짐에 따라 점차 감소합니다. Toeplitz 행렬에는 고유 벡터 (및 그람 행렬의 고유 벡터가 스케일링까지의 주요 구성 요소 임)로 연속 푸리에 모드가 있으므로 Q1에는 입니다. PC로 주파수가 증가하는 사인파를 얻는 것은 놀라운 일이 아닙니다.

유용 할 수 있을지 모르겠다 (Q2). 내 경험상, 그것은 성가신 유물로 나타나는 경향이 있습니다. 즉, 사람들은 약간의 데이터를 가지고 PCA에서 푸리에 모드와 비슷한 것을 얻고 그것이 무엇을 의미하는지 궁금해하기 시작하지만 원래 시계열의 시간 이동으로 인한 것입니다.


정말 고마워요! 예, 행을 따라 데이터를 생각했습니다. 이에 대한 몇 가지 직관 얻을로 한 단계 수 있었던 사고에 의해 (그러나 이것은 막연한 희망을 정말 ... 여기에 보람을 것 같다) - 내가 정확히 어떻게 푸리에 분석 작업 오늘날까지 이해 적이 있기 때문에 Q2는 온다
고트 프리트를 Helms

그건 그렇고, 당신은 32 가치 시계 시리즈를 공유 하시겠습니까? 그람 행렬을 보여주는 그림을 삽입하고 싶습니다. 귀하의 데이터로 직접 할 수 있습니다.
amoeba

내 질문에 링크가 보입니까? 그것은 exce.l을 사용하여 만든 웹 페이지로 리디렉션됩니다. 4 또는 5 개의 서브 페이지가 있으며, 화면 하단의 탭 막대에 대한 클릭으로 설치에서 "firefox"로 선택할 수 있습니다. 첫 번째 서브 페이지는 데이터 목록을 보여줍니다. 그러나 수직 : 새 테이블에서 첫 번째 행으로 가져 와서 오른쪽으로 순환하면서 31 행을 추가해야합니다. 불편한 경우 데이터를 질문에 추가 할 수도 있습니다.
Gottfried Helms

와우, 나는 그것이 스크린 샷이 아니라 전체 온라인 스프레드 시트라는 것을 몰랐습니다! 감사.
amoeba
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.