통계학자가 랜덤 행렬을 정의한 이유는 무엇입니까?


18

저는 10 년 전에 수학을 공부했습니다. 그래서 수학과 통계 배경이 있지만이 질문이 저를 죽이고 있습니다.

이 질문은 여전히 ​​약간 철학적입니다. 통계학자가 랜덤 행렬로 작업하기 위해 모든 종류의 기술을 개발 한 이유는 무엇입니까? 무작위 벡터가 문제를 해결하지 않았습니까? 그렇지 않다면 랜덤 행렬의 다른 열의 평균은 얼마입니까? Anderson (2003, Wiley)은 랜덤 벡터를 단 하나의 열을 갖는 랜덤 매트릭스의 특별한 경우로 간주합니다.

무작위 행렬이 있다는 점을 알지 못합니다 (그리고 그것이 무지하기 때문이라고 확신합니다). 그러나 나와 함께 견뎌내십시오. 20 개의 랜덤 변수를 가진 모델이 있다고 상상해보십시오. 조인트 확률 함수를 계산하려면 왜 벡터 대신 행렬로 그려야합니까?

내가 무엇을 놓치고 있습니까?

추신 : 잘못 태그 된 질문에 대해 죄송하지만 무작위 행렬에 대한 태그가 없었으며 아직 만들 수 없습니다!

편집 : 제목에서 행렬을 행렬로 변경했습니다.


1
나는 당신이 그것을 매트릭스로 재정렬 된 임의의 벡터로 개념적으로 생각하고 있다고 생각합니다.
Matthew Gunn


9
행렬이 왜 관심이 있는지 물어볼 수도 있습니다. 현실에서 관찰되거나 측정 된 현상을 나타내는 데 사용되는 임의의 매트릭스를 무작위로 보는 것이 완벽합니다. 결과적으로 랜덤 그래프의 인접 행렬부터 샘플 공분산 행렬에 이르기까지 랜덤 행렬에 대한 다양한 유형 및 모델이 가능합니다.
whuber

2
@ Aksakal OP의 요점은 언제 무작위 행렬로 무언가를 분석하는 것이 유용한 지 생각합니다 . 예를 들어 이미지 분류에서 일반적으로 이미지 매트릭스를 벡터로 변환합니다. 매트릭스 '분석'이 없습니다. 따라서 whuber의 의견은 지금까지 가장 좋은 대답입니다. 예를 들어 공분산 행렬은 양의 반 정밀도 여야합니다. 임의 공분산 행렬을 시뮬레이션하려면 벡터보다 행렬 사양을 사용하는 것이 더 쉽습니다.
seanv507

2
랜덤 매트릭스는 랜덤 텐서의 특별한 경우입니다.
Anony-Mousse-복지국 모니카

답변:


23

그것은 당신이 어느 분야에 있는지에 달려 있지만, 무작위 행렬 연구를위한 초기 초기 추진 중 하나는 원자 물리학에서 나 왔으며 Wigner에 의해 개척되었습니다. 여기 에서 간략한 개요를 찾을 수 있습니다 . 구체적으로, 고유 값 사이의 상관 관계가 핵 붕괴 과정의 방출 스펙트럼에 대한 통찰력을 제공했기 때문에 관심있는 톤을 생성하는 랜덤 매트릭스 의 고유 값 (원자 물리학의 에너지 수준)이었습니다.

보다 최근에는이 이론 에서는 타일링 이론 , 통계 물리학, 통합 과 같은 겉보기 관련이없는 필드와의 놀라운 연결과 함께 랜덤 매트릭스의 최대 고유 값에 대한 Tracy-Widom 분포 가 출현하면서 크게 부활했습니다. 시스템 , KPZ 현상 , 무작위 조합 및 심지어 Riemann 가설 . 여기에서 더 많은 예제를 찾을 수 있습니다 .

보다 실제적인 예를 들어, 행 벡터 행렬에 대한 자연스런 질문은 PCA 구성 요소의 모양입니다. 데이터가 일부 분포에서 나온 것으로 가정하고 공분산 행렬 고유 값을 살펴봄으로써 휴리스틱 추정값을 얻을 수 있습니다. 공분산 행렬 고유 값은 벡터 분포의 분포에 관계없이 (이유 내 에서) 임의의 행렬 보편성 에서 예측됩니다 . 고유 값은 항상 알려진 클래스 집합에 접근합니다. 이것을 랜덤 행렬에 대한 일종의 CLT라고 생각할 수 있습니다. 예를 보려면 이 백서 를 참조하십시오 .


답변 주셔서 감사합니다. 나는 그것이 수학적 기술과 관련이 있다고 생각했다. Bur는 이제 모든 것이 의미가 있습니다. 물리학은 항상 수학과 다른 방향으로있었습니다.
Eduardo

Wigner의 논문 은 1950 년대 중반에 있었고 Wishart의 논문 은 1920 년대 후반에있었습니다. Wigner가 제 생각에 첫 번째 큰 추진을했다고 주장하기는 어렵습니다.
Aksakal

13

임의 벡터의 적용에 익숙한 것 같습니다. 예를 들어, 나는 매일 이런 종류의 랜덤 벡터를 다룹니다 : 다른 테너의 이자율. 연방 준비 은행은 H15 시리즈를 가지고 있습니다. 4 주, 3 개월, 6 개월 및 1 년 재무부 보고서 를보십시오. 이 4 가지 비율을 4 개의 요소가있는 벡터로 생각할 수 있습니다. 그것은 무작위로 필요합니다. 아래 그림의 역사적 가치를보십시오.

여기에 이미지 설명을 입력하십시오

임의의 숫자와 마찬가지로 우리 자신에게 물어볼 수도 있습니다. 그들 사이의 공분산은 무엇입니까? 이제 4x4 공분산 행렬을 얻습니다. 한 달의 일일 데이터로 추정하면 겹치지 않게하려면 매년 12 개의 서로 다른 공분산 행렬을 얻습니다. 랜덤 계열의 표본 공분산 행렬은 그 자체로 임의의 대상입니다. Wishart의 논문 "일반 다중 집단에서 표본으로 생성 된 제품 순간 분포"를 참조하십시오. 여기 . 그를 쫓아 온 배포판 이 있습니다 .

이것은 랜덤 행렬을 얻는 방법 중 하나입니다. 이제 알 수 있듯이 RTM (Random Matrix Theory)이 재무에 사용되는 것은 놀라운 일이 아닙니다.


1
"1 개월 데이터"로 추정한다고 말하면 "1 개월 분의 일일 데이터"를 의미합니까?
John

1
@John,이 예에서는 매일 그렇습니다. 그러나 일부 시리즈는 주식 가격과 같이 하루 종일 측정됩니다. 주식 포트폴리오가있는 경우 매우 높은 빈도로 하루 동안의 공분산 행렬을 얻을 수 있습니다.
Aksakal

3
+1. 여기서는 임의 행렬을 동기를 부여하는 한 가지 방법이 랜덤 벡터 사이 의 관계 에만 관심이 있다는 것입니다 . 이것은 자연스럽게 벡터 대신 행렬에 대한 생각을 유발합니다.
Cliff AB

@Aksakal 언급 한 데이터는 매일뿐만 아니라 매월 빈도로 제공됩니다. 한 달의 월간 데이터를 사용하여 공분산 행렬을 추정하는 것이 의미가 없으므로 게시물을 수정하기 전에 혼란 스럽습니다.
John

@John, 월별 또는 주별 데이터, 겹치거나 겹치지 않는 등의 공분산 행렬을 추정 할 수 있습니다. 올바른 방법은 없습니다.
Aksakal

8

이론 물리학에서 랜덤 매트릭스는 특정 대칭을 갖는 시스템의 에너지 스펙트럼의 보편적 인 특징을 이해하는 데 중요한 역할을합니다.

이론 물리학에 대한 나의 배경은 여기서 약간 편향된 관점을 제시 할 수 있지만, 지금까지 랜덤 매트릭스 이론 (RMT)의 인기는 물리학에서의 성공적인 적용에서 비롯된 것이라고 제안하기까지합니다.

예를 들어 너무 자세하게 설명하지 않고 양자 역학에서의 에너지 스펙트럼은 해밀턴 행렬로 표현 될 수있는 해밀턴 시스템의 고유 값을 계산함으로써 얻을 수 있습니다. 물리학 자들은 종종 특정 시스템에 관심이 없지만 혼돈 적 특성을 갖는 양자 시스템의 일반적인 특성이 무엇인지 알고 싶어합니다. 이로 인해 Hermitian Hamiltonian 행렬의 값이 에너지 또는 기타 매개 변수의 변화에 ​​따라 행렬 공간을 심하게 채울 수 있습니다. 예를 들어 경계 조건). 이것은 물리적 시스템의 클래스를 임의의 매트릭스로 취급하고 이들 시스템의 평균 특성을 보도록 동기를 부여합니다. 더 깊이 들어가고 싶다면 Bohigas-Gianonni-Schmidt 추측에 관한 문헌을 추천합니다.

요컨대, 시간 반전 대칭을 갖는 시스템의 에너지 레벨은 시간 반전 대칭을 갖지 않는 시스템의 에너지 레벨 (일반적으로 자기장을 추가하는 경우)과는 보편적으로 다르다는 것을 보여줄 수 있습니다. 실제로 가우시안 랜덤 매트릭스를 사용한 아주 짧은 계산은 에너지 레벨이 두 시스템에서 서로 다른 경향이 있음을 보여줍니다.

이러한 결과는 입자 물리학 또는 mesoscopic transport 이론과 같은 다른 분야에 큰 영향을 미쳤으며 나중에는 금융 시장에서도 다른 대칭을 이해하는 데 도움이 될 수 있습니다.


1
나는 물리학 : 너무 많은 종료 이유는 "뇌 손상"
Aksakal

원자 물리학 자 이전의 Wishart와 같은 통계 학자.
kjetil b halvorsen

5

선형 맵은 벡터 공간 사이의 맵입니다. 선형 맵이 있고 도메인 및 범위 공간에 대한 기준을 선택했다고 가정하십시오. 그런 다음 선형 맵을 인코딩하는 행렬을 작성할 수 있습니다. 이 두 공간 사이의 임의 선형 맵을 고려하려면 임의 행렬 이론을 생각해보아야합니다. 랜덤 프로젝션 은 그러한 것의 간단한 예입니다.

또한 물리학에는 매트릭스 / 텐서 값을 갖는 객체가 있습니다. 점성 응력 텐서는 이러한 하나의 (a 진정한 동물원 중)이다. 거의 균질 한 점탄성 재료에서 변형 (탄성, 점성 등)을 모델링하여 응력이 작은 분산을 갖는 랜덤 텐서로 지적하는 것이 유용 할 수 있습니다. 이 응력 / 변형에는 "선형 맵"이라는 의미가 있지만, 랜덤 매트릭스의 이러한 적용을 이미 매트릭스였던 것을 랜덤 화하는 것으로 묘사하는 것이 더 정직합니다.


4

이미지 프로세싱에서 애플리케이션으로서의 압축 감지는 2D 신호의 결합 된 측정으로서 랜덤 매트릭스에 의존한다. 이러한 행렬의 특정 속성, 즉 일관성 (coherence )은 이러한 행렬에 대해 정의되며 이론에서 중요한 역할을합니다.

크게 단순화하면 가우스 행렬의 특정 제품과 희소 입력 신호의 L1 표준을 최소화하면 예상보다 훨씬 많은 정보를 복구 할 수 있습니다.

내가 아는이 분야에서 가장 주목할만한 초기 연구는 Rice University의 연구입니다 : http://dsp.rice.edu/research/compressive-sensing/random-matrices

"신호 측정"으로서 매트릭스 제품의 이론은 적어도 WW2까지 거슬러 올라갑니다. 전 광산 교수가 제게 말하면서 매독에 대해 모든 군대 입대자를 개별적으로 시험하는 것은 비용이 많이 들었습니다. 이 샘플들을 체계적인 방식으로 혼합하면 (각 혈액 샘플의 일부를 혼합하고 테스트함으로써) 테스트 수행에 필요한 횟수를 줄일 수 있습니다. 이것은 희소 행렬을 곱한 임의의 이진 벡터로 모델링 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.