벡터의 내적의 분산에 대한 단위 벡터의 모든 분포에 대한 최소값은 얼마입니까?


10

를 최소화 하는 차원 단위 구 ( )에서 무작위 벡터, 대한 분포를 찾으려고합니다. 는 \ mathbb {E} [x_i ^ Tx_j] = 0 제약 조건을 따릅니다 .nx1,,xnkn>kmaxijVar(xiTxj)E[xiTxj]=0

나는 일부 분포를 시도했고 거의 모든 분산이 1/k 입니다. 예를 들어, 각 x_i 의 각 좌표가 \ left \ {-1 / \ sqrt {k}, 1 / \ sqrt {k} \ right \}xi 에서 독립적으로 균일하게 선택된 분포와 각 x_i 의 분포가 모두 는 k- 차원 단위 구의 분산이 1 / k 인 독립 균일 벡터입니다 .{1/k,1/k}xik1/k

가요 1/k 모든 분포 중에서 최소 분산을?


얼마나 관심이 있습니까? 즉, n> 100k에 대해서만 작동하는 1 / 100k의 하한값은 흥미롭지 않습니까?
daniello

@daniello, 당신은 n> ck에 대해 1 / ck의 하한을 의미합니까? 이것을 증명하는 방법?
peng

내가 질문에서 이해하지 못하는 것 : 처음에는 단위 벡터를 통한 분포를 말하지만 모든 분포가 단위 벡터를 생성하려고 시도한 것은 아닙니다 ... 모든 , ? xiE[|xi|]=1
daniello

@deniello, 나는 모든 벡터를 "단위"로 만들려고하였습니다 .. 죄송합니다, 정규화 후에 "Gaussian"벡터를 정규화하는 것을 잊었습니다. 정규화하면 균일 한 벡터와 같습니다. 이 실수를 지적 해 주셔서 감사합니다.
peng

답변:


8

나는 동등하지만 단순 해 보이는 문제의 공식을 제시하고, ( n / k -1) / ( n - 1) 의 하한을 보여줄 것이다 . 또한 양자 정보에서 열린 문제에 대한 연결을 보여줍니다. [수정판 3 편집 : 이전 개정판에서, 아래에 표시된 하한에 도달 한 경우의 정확한 특성화가 어려울 수 있다고 주장했다. 복잡한 경우의 유사한 질문은 SIC-POVM의 양자 정보. 그러나 SIC-POVM에 대한이 연결이 잘못되었습니다. 자세한 내용은 아래의 "양자 정보에서 SIC-POVM에 잘못 연결됨"섹션을 참조하십시오.

동등한 조제

우선 daniello의 답변에서 이미 지적했듯이 Var ( x i T x j ) = E [( x i T x j ) 2 ] − E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. 따라서 나머지 답변에서 분산을 잊어 버리고 대신 최대 ij E [( x i T x j ) 2 ] 를 최소화 합니다.

다음으로, 목표가 max ij E [( x i T x j ) 2 ] 를 최소화하는 것으로 결정되면 E [ x i T x j ] = 0 이라는 제약 조건을 무시할 수 있습니다. 단위 벡터 x 1 ,…, x n 이면 목적 함수의 값을 변경하지 않고 E [ x i T x j ] = 0 을 만족시키기 위해 확률 1/2로 각각 독립적으로 부정 할 수 있습니다. max ij E [( x 나는 T x j) 2 ].

또한 목적 함수를 최대 ij E [( x i T x j ) 2 ]에서 (1 / ( n ( n -1)))로 변경 ∑ ij E [( x i T x j ) 2 ] 최적의 값을 변경하지 않습니다. 평균이 최대 값이기 때문에 후자는 최대 값입니다. 그러나 항상 E의 값을 만들 수있다 [( X I T X J ) (2) (의 다른 선택을위한 I , J ) ( Ij ) n 벡터 x 1 ,…, x n을 무작위로 치환하여 같습니다 .

따라서 모든 nk 에 대해 문제의 최적 값은 (1 / ( n ( n -1))) 의 최소값과 같습니다. ) ij E [( x i T x j ) 2 ] 여기서 x 1 ,…, x n 은 vectors k의 단위 벡터 를 값으로 취하는 랜덤 변수입니다 .

그러나, 기대의 선형성에 의해, 이러한 목적 함수는 기대치 E 같다 [(1 / ( N ( N -1))) Σ IJ ( X I T X J ) 2 ]. 최소값은 평균치이므로 확률 분포를 더 이상 고려할 필요가 없습니다. 즉, 위 문제의 최적 값은 다음의 최적 값과 같습니다.

단위 벡터 x 1 ,…, x n ∈ ℝ k 를 선택하여 (1 / ( n ( n -1))) ∑ ij ( x i T x j ) 2 을 최소화 합니다.

하한

이 등가 공식을 사용하여 최적 값이 ( n / k -1) / ( n - 1) 이상임을 증명할 것입니다 .

1≤ in의 경우, X i = x i x i T 가 단위 벡터 x i에 해당하는 순위 1 프로젝터가되도록합니다 . 그런 다음 ( x i T x j ) 2 = Tr ( X i X j )를 유지합니다.

Y = ∑ i X i로 하자 . 그런 다음 ∑ ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) -n = Tr ( Y 2 ) -n 입니다.

Cauchy-Schwarz 불평등은 Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k 이므로 ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) − nn 2 / k - n . n ( n -1)으로 나누면 목표 값이 ( n / k -1) / ( n - 1) 이상임을 알 수 있습니다.

특히, n = k +1 인 경우 daniello의 답은 최적 값에서 2의 계수 내에 있습니다.

이 하한은 언제 달성 할 수 있습니까?

이 하한 ( n / k -1) / ( n - 1)을 얻는 것은 Y = ( n / k ) I 를 만드는 것과 같습니다 . 나는 그것이 달성 될 때 정확한 특성을 알지 못하지만 다음과 같은 충분한 조건이 존재합니다.

  • 경우 N = K +1, 그것을 고려하여 달성 가능한 K 정규 형성 한 단위 벡터 (K) 2 / (상기 개선 원점에 중심 -simplex를 K ( K 최적의 1 / 행 daniello의 대답 +1)) K를 2 .
  • 하면 N 의 배수 (K)는 , 그것의 ℝ의 정규직 교 기저 고정함으로써 명확 쉽지만 케이 및 상기 베이시스 벡터들 각각을 할당하는 N / KV 1 , ..., V , N .
  • 보다 일반적으로 마지막 글 머리표보다, k를 선택 하고 n = n 1n = n 2를 모두 얻을 수 있다면, 동일한 kn = n 1 + n 2에 대해서도 얻을 수 있습니다. 특히, n = a k + b 인 경우 , abab ≥0을 만족 하는 정수 입니다.

세부 사항을 확인하지는 않았지만 구형 2 디자인 은이 하한을 달성하는 솔루션을 제공하는 것으로 보입니다 .

양자 정보에서 SIC-POVM에 잘못 연결

이전 버전에서는 다음과 같이 말했습니다.

나는 이것에 완전히 대답하는 것이 어려운 질문이라고 생각합니다. 그 이유는 복소수 벡터 공간 consider k를 대신 고려한다면 ,이 질문은 양자 정보의 열린 문제와 관련이 있기 때문입니다.

그러나이 관계는 틀렸다. 이유를 설명하겠습니다.

보다 정확하게는 다음 문제를 고려하십시오.

(1 / ( n ( n -1))) 을 최소화 하려면 단위 벡터 x 1 ,…, x n ∈ ℂ k 를 선택하십시오 ∑ ij | x i * x j | 2 .

위의 하한은이 복잡한 버전에서 동일하게 유지됩니다. 복잡한 버전에서 n = k 2 인 경우를 고려하십시오 . 그런 다음 하한은 1 / ( k +1)과 같습니다.

지금까지는 정확했습니다.

세트 K 2 단위 벡터 X 1 , ..., X (K) 2 ∈ ℂ의 K 불리며 하한 달성 SIC-POVM 차원에 (k)를 ,

이 부분이 잘못되었습니다. SIC-POVM는 세트 인 K 2 단위 벡터 X 1 , ..., X N ∈ ℂ의 K 되는 | x i * x j | 모든 ij에 대해 2 = 1 / ( k +1)입니다 . 요구 사항은 모든 쌍을 위해 보유해야 여기에 있습니다 내가j를 , 모든 쌍 이상 단지의 평균없는 내가j를 . "등가 제형"섹션에서, 우리는 최대 최소화와 평균 최소화 사이의 동등성을 보여 주었지만, 이것은 x 1 때문에 가능했습니다.,…, x n 은 단위 벡터를 취하는 랜덤 변수입니다. 여기서 x 1 ,…, x n 은 단위 벡터이므로 동일한 트릭을 사용할 수 없습니다.


5

질문에 대한 빠르고 더러운 답변은 "아니오, 분산이 더 작을 수 있습니다"입니다. 표준 기반으로하고 다음과 같은 임의의 프로세스를 고려하십시오. 로 설정하고 . 다른 벡터 들어 (대 )에 할당 일대일 방식이다. 그런 다음, 각 에 대해 를 그대로 유지 하거나 확률 뒤집습니다 ( ) .v1,v2,,vk{1,2,,k+1}xi=xj=v1xtt{i,j}v2,,vkt{1,,k+1}xixi12

쉽게 볼이 - 중 및 직교하거나 동일한 확률 / 반대 방향으로 가리킬 각.E[xaxb]=0xaxb12

반면에 입니다. 우리는이 경우에만,이 확률 일어나는 . 그렇지 않으면 입니다. 따라서 우리는 모든 , 다음을 . Var[xaxb]=E[(xaxb)2](xaxb)2=1{a,b}={i,j}1(k+12)(xaxb)2=0ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

내 직감은 이것이 얻는 것처럼 나쁘지만 작다는 증거입니다. 더 흥미로운 점은이 구성이 n >> k에 대해 분해되는 것 같고 가 독립적으로 선택되어야 할 때 (다른 분포에서) 가능하다는 것입니다.xi

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.