p- 노름 볼에서 균일 한 소음 발생 (


11

n 차원 의 p-norm 공에서 나오는 균일하게 분포 된 소음을 생성하는 함수를 작성하려고 합니다.

||x||pr

서클 ( ) ( http://mathworld.wolfram.com/DiskPointPicking.html )에 대한 가능한 해결책을 찾았 지만 p의 다른 값으로 확장하지 못했습니다 .p=2p

균일 분포에서 임의의 샘플을 그리고 주어진 제약 조건을 충족하지 않으면 다시 그려서 시도했습니다. 그러나 그것이 추악한 해결책 일뿐 만 아니라 높은 차원에서는 계산이 불가능합니다.


1
유클리드 거리 (p = 2) math.stackexchange.com/questions/87230/을 사용하여 n 크기의 구면에 대한 답을 찾을 수 있습니다 ...하지만 여전히 다른 p-norm에 이것을 사용하는 방법을 잘 모르겠습니다. 사용 된 유클리드 거리를 거리와 다른 관계로 변경하기 만하면됩니까?
Taeke de Haan

2
이 논문이 많이 있지만, 대부분은 유료화 뒤에 : link.springer.com/article/10.1007/s00184-011-0360-x 또는 참조 google.com/...을
할보 르센 kjetil B

3
어떤 볼륨 측정법과 관련하여 "균일" 결국, ball을 사용한다면 왜 유클리드 볼륨이 관심을 가질까요? p
whuber

@ whuber 나는 이것이 명확하게 지정되어 있지 않기 때문에 솔직히 확신하지 못하지만이 경우 다른 메트릭이 임의적 인 것처럼 보이기 때문에 p-norm에서 기대할 것입니다.
Taeke de Haan

1
기계 학습 과제에서 문제가 발생합니다. "문제는 204 차원의 2 클래스 분류 문제입니다. 작은 레이블이있는 훈련 세트는 클래스 당 50 개의 샘플 크기를 갖습니다. 레이블이없는 데이터는 20,000 개의 추가 샘플을 제공합니다. 그러나이 샘플은 어떤 종류의 손상을 입었습니다. 우리가이 부패에 관한 한 경우에만 추가 정보는,이 첨가제 균일 한 잡음인지하고 잡음이 고정 된 P-규범 공에서 온다, , 모두 여기서 P 와 반경 R은 알려져 있지 않다. " 레이블이없는 데이터에서 가장 낮은 오류율을 얻어야합니다. ||엑스||아르 자형아르 자형
Taeke de Haan

답변:


5

kjetil b halvorsen ( https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=758215 )이 제안한대로 종이에서 전체 솔루션을 찾았습니다 . 솔직히 배후의 수학을 이해하는 데 어려움이 있지만 최종 알고리즘은 매우 간단합니다. 우리가 차원 을 가지고 있다면 , 반경 r 과 규범 pnrp :

1) 생성 독립적 랜덤 실제 스칼라 ε = ˉ G ( 1 / P , P ) , ˉ G ( μ , σ 2 ) 지수에서 다른 전력 일반화 가우시안 분포이다 ( E - | X | P 를 대신 단지 p = 2 )nεi=G¯(1/p,p)G¯(μ,σ2)e|x|pp=2

2) 벡터 구조체 성분 난을 * ε I , 여기서 s는 제가 독립적 임의의 징후가xsiεisi

3) 생성하십시오 . 여기서 wz=w1/nw 는 [0, 1] 간격으로 균일하게 분포 된 랜덤 변수입니다.

4) y = r z x를 반환y=rzx||x||


2
완전성 을 위해 답에 가 무엇인지 알 수 있습니까? G
Stéphane Laurent

업데이트되었습니다
Taeke de Haan

2
G가 인 일반화 가우시안 분포 (지수에서 다른 전력 대신의 P = 2 ). 이것은 p-norm에 의존하는 단일 pdf의 곱인 다수의 독립적 인 일반 가우시안 분포 변수 x i 로 구성된 벡터 x에 대한 분포를 만듭니다 . 에프 ( x ) e이자형|엑스|=2엑스엑스나는
에프(엑스)이자형|엑스|
Sextus Empiricus

@MartijnWeterings 감사합니다. 많이 업데이트되었습니다.
Taeke de Haan 2016

감사. 정보를 위해 R 패키지 pgnorm 에이 분포의 샘플러가 있습니다.
Stéphane Laurent

3

균일하게 분포 된 다변량 변수 사용

Taeke는 구체적으로 2-norm 및 1-norm 사례를 설명함으로써 아래 텍스트가보다 직관적 인 기사에 대한 링크를 제공합니다.

2- 노름 x2r

샘플 방향

이 결과를 사용할 수 있습니다 http://mathworld.wolfram.com/HyperspherePointPicking.html

다변량 가우시안 분포 변수 (ID 공분산 행렬 포함)는 거리 또는 제곱합에만 의존합니다.X

f(X1,X2,...,Xn)=1in12πe12xi2=12πe121inxi2

따라서 는 n- 차원 대구면에 균일하게 분포되어있다.XX2


샘플 거리

완료하려면 구의 균일 분포를 공의 균일 분포로 변경하기 위해 거리 만 샘플링하면됩니다. (디스크 포인트 선택에 대한 링크 된 예와 다소 비슷합니다)

단순히 균일 한 분포로 을 샘플링 하는 경우 중심 근처에서 상대적으로 밀도가 높아집니다 (볼륨은 r n으로 스케일 되므로 점 의 일부 r 은 볼륨 r n 에 도달합니다. 중심이며 균일 한 분포를 의미하지 않습니다)rrnrrn

대신 균일 분포에서 샘플링 된 변수 의 번째 근 을 사용하면 균일 한 분포를 얻게됩니다.n

1- 노름 x1r

방향

이 경우 가우스 분포 대신 라플라스 분포에서 를 샘플링 하고 1- 노름으로 나눕니다. XX 은 n- 차원 1- 노름 구체에 균일하게 분포된다.X|X|1

공식적인 증거는없고 직감 만 있습니다

(pdf가 위치와 독립적이므로, 1- 노름이 동일한 무한대 영역 / 볼륨은 같은 확률 를 가질 것이며, 이것을 단위 표면으로 접을 때 동일한 f ( x )를 기대합니다 d Af(x)dVf(x)dA )

그러나 시뮬레이션 테스트는 좋아 보인다.

simulation picking 20000 values uniformly distributed

library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)

xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
     sqrt((0.5-0.5*(xi+yi))^2+zi^2),
     pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)

거리

거리는 2- 노름 경우와 유사합니다 (볼륨은 여전히 rn ).

p- 노름 xpr

이 같은 원리를 따라하고자하는 경우이 경우, 당신이 분포에서 샘플링 할 필요가 (가설). 이것들은 일반 정규 분포 이며 아마도 분포 G 와 관련이 있습니다.f(x)e|x|pG()


1
p

1
아르 자형=1/와이=아르 자형엑스||엑스||
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.