행과 열 길이에 제약이있는 랜덤 행렬


25

행과 열을 갖는 임의의 비 제곱 행렬 , 평균 = 0으로 임의로 분포 된 요소 를 생성 하고 각 행의 길이 (L2 규범)가 이고 각 열의 길이가 . 마찬가지로, 제곱 값의 합은 각 행에 대해 1이고 각 열에 대해 입니다.RC1RCRC

지금까지 나는 이것을 달성하는 한 가지 방법을 발견했다. 매트릭스 요소를 무작위로 무작위로 초기화하고 (예를 들어, 평균과 임의의 분산이 0 인 균일, 정규 또는 라플라스 분포에서) 행과 열을 로 번갈아 정규화한다 행 정규화로 끝납니다. 이것은 원하는 결과에 상당히 빠르게 수렴하는 것처럼 보입니다 (예 : 및 의 경우 열 길이의 분산은 일반적으로 ~length=1R=40C=80 0.00001 회 반복 후 ).이 빠른 수렴 속도에 의존 할 수 있는지 확실하지 않습니다 일반적으로 (다양한 매트릭스 차원 및 초기 요소 분포).2

내 질문은 이것입니다 : 반복하지 않고 원하는 결과 ( , )를 직접 달성하는 방법이 있습니까? 행 / 열 정규화? 예를 들어 랜덤 벡터를 정규화하는 알고리즘과 같은 것 (요소를 무작위로 초기화하고, 제곱 값의 합을 측정 한 다음 각 요소를 공통 스칼라로 스케일링) 그렇지 않은 경우 위에서 설명한 반복 방법 의 수렴 률 (예 : 오류 < ϵ 까지의 횟수 반복)에 대한 간단한 특성이 있습니까?C O L U M N L의 E N g t H S = √는아르 자형영형 이자형h에스=1기음영형 이자형h에스=아르 자형기음<ϵ


1
이는 반복 비례 피팅이라고도하는 Sinkhorn-Knopp 알고리즘과 매우 유사합니다.
추기경

6
또한 "무작위"행렬의 의미를 정의해야합니다. 예를 들어, 설명하는 절차는 (거의 의심의 여지없이) 원하는 공간에 균일하게 임의의 행렬을 생성하지 않습니다.
추기경

1
@cardinal 좋은 지적. 그러나 행과 열을 임의로 정렬하기 위해 임의의 순열 행렬 쌍을 사후 곱함으로써 모든 구성 요소에 대해 동일한 (마진) 분포를 얻을 수 있습니다.
whuber

1
@ whuber : 그렇습니다. 비록 공동 배포가 여전히 이상 할 수 있습니다. "포스트 곱하기"는 왼쪽과 오른쪽 "수렴 후"에 곱하는 것을 의미한다고 가정합니다 (예 : 오른쪽에 곱하는 것).
추기경

9
조금 생각 후 사실, 난 당신이 알고리즘은 생각 을 정확하게 아주 약간의 수정과 함께 Sinkhorn - Knopp 알고리즘. 하자 원래 행렬 및하자 Y는 같은 크기의 행렬이되도록 Y의 난의 J = X 2 I J엑스와이와이나는j=엑스나는j2 . 그런 다음 알고리즘에 Sinkhorn-Knopp인가에 해당 최종 단계에서 사용자가 복용하여 원하는 형태를 복구 X I J = S g N ( X I J ) 와이 . Sinkhorn-Knopp는 병리학적인 상황이 아니라면 수렴되도록 보장됩니다. 그것에 대해 읽는 것이 매우 도움이 될 것입니다. 엑스^나는j=에스(엑스나는j)와이나는j
추기경

답변:


6

@ cardinal이 의견에서 말했듯이 :

조금 생각 후 사실, 난 당신이 알고리즘은 생각 을 정확하게 아주 약간의 수정과 함께 Sinkhorn - Knopp 알고리즘. 하자 원래 매트릭스를하고하자 Y는 같은 크기와 같은 그의 행렬 Y의 난의 J = X 2 I J . 그런 다음 알고리즘에 Sinkhorn-Knopp인가에 해당 Y 최종 단계에서 사용자가 복용하여 원하는 형태를 복구 X I J = S g N ( X I J ) 엑스와이와이나는j=엑스나는j2와이 . Sinkhorn-Knopp는 병리학적인 상황이 아니라면 수렴되도록 보장됩니다. 그것에 대해 읽는 것이 매우 도움이 될 것입니다.엑스^나는j=에스(엑스나는j)와이나는j

... 원래 질문에서 제안한 반복 알고리즘은 Sinkhorn-Knopp 알고리즘과 매우 유사합니다. 흥미롭게도 IPF 위키 백과 페이지에 설명 된 바와 같이 IPF ( 반복 비례 피팅) 와 매우 유사한 것으로 보이며 뉴턴의 방법 및 기대 최대화와 관련이 있습니다 (모두 동일한 제한이 있음).

이러한 반복 방법은 종종 닫힌 형식 솔루션이없는 문제에 적용되므로 질문에 대한 대답이 부정적이라고 가정합니다. 행 / 열 반복없이 원하는 솔루션을 얻을 수있는 방법이 없습니다.


(+1)이 질문에 대한 귀하의 지속적인 관심과 독립적 인 후속 조치를 위해. :-)
추기경
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.