“Laplace noise”란 무엇입니까?


9

현재 Laplace 메커니즘을 사용하여 차등 개인 정보 보호 알고리즘을 작성 중입니다.

불행히도 통계에 대한 배경 지식이 없으므로 많은 용어를 알 수 없습니다. 이제 저는 Laplace noise 라는 용어에 걸려 넘어 집니다. 데이터 세트의 차등을 모두 비공개로 만들려면 Laplace 분포에 따라 Laplace 노이즈를 함수 값에 추가하는 것에 대해 이야기하십시오.

k(X)=f(X)+Y(X)

(k는 차동 개인 값, f 평가 기능에 의한 반환 값, Y 라플라스 노이즈)

이것은 내가 Wikipedia https://en.wikipedia.org/wiki/Laplace_distribution 에서 가지고있는이 기능에 따라 Laplace 배포에서 임의의 변수를 생성한다는 것을 의미합니까 ?

Y=μb sgn(U)ln(12|U|)

업데이트 : 위의 함수에서 가져온 100 개의 임의 변수를 플로팅했지만 Laplace 분포를 제공하지는 않습니다 (심지어는 아닙니다). 그러나 Laplace 배포판을 모델링해야한다고 생각합니다.

UPDATE2 :

그것들은 내가 가진 정의입니다.

(라플라스 메커니즘). 함수 f : N ^ {| X |} → R ^ k가 주어지면 f:N|X|RkLaplace 메커니즘은 다음과 같이 정의됩니다. ML(x,f(·),ϵ)=f(x)+(Y1,...,Yk) 여기서 Y는 Lap (∆f / \ epsilon) 에서 추출한 iid 랜덤 변수입니다.Lap(f/ϵ)

만큼 잘:

Y (X)를 생성하려면 일반적으로 평균이 0이고 Δ (f) / ε 스케일 모수가있는 라플라스 분포를 사용하는 것이 좋습니다.


두 번째 방정식은 PDF가 아닌 CDF입니다. PDF에서 샘플링하려고합니다. 다음은 Laplace (bixponential) 배포판에서 샘플링 할 파이썬 코드입니다 ( docs.scipy.org/doc/numpy-1.9.3/reference/generated/… )
Luca

1
"Laplace noise"를 언급 한 정확한 기준을 제공 할 수 있습니까? Y가 Laplace 분포를 따르는 X에 rv Y를 추가하는 것을 의미한다고 생각합니다. 업데이트에 관해서는이 방법 효과가 있습니다. 코드에 실수를 한 것이 틀림 없습니다. 또는 5000 번 이상 시도하면 100 번만 그렸다는 사실입니다. Laplace "...

내 줄거리는 실제로 CDF와 비슷하게 보이고 코드와 함께 위에 추가했습니다. 인용구에 대한 링크는 다음과 같습니다. 1 2
Lotte

나는 또한 내가 전에 사용하고있는 코드를 보았는데 왜 그런 결과를 얻었는지 모른다. 줄거리는 내 코드를 보여줍니다. f = 1 및 eps = 1에 대해 1000 번 반복됩니다. 그러나 "Laplace noise"를 올바르게 이해하면 내 요점이 있다고 생각합니다. 어떻게 든 운동 할 수있는 코드.
롯데

답변:


14

정확합니다. Laplace 노이즈를 추가한다는 것은 변수 Laplace 분포 뒤에 변수 를 추가 한다는 의미입니다 . 노이즈 라고하는 데는 여러 가지 이유가 있습니다 . 먼저, 신호가 어떤 채널을 통해 전송되고 채널의 불완전한 특성으로 인해 수신 된 신호 에 노이즈 가있는 신호 처리를 생각 하면 노이즈와 신호를 분리해야합니다. 둘째, 암호화에서 의사 난수 노이즈 에 대해 이야기 하고 차등 개인 정보 보호는 암호화와 관련이 있습니다. 셋째, 통계 및 기계 학습에서 통계 노이즈 에 대해 이야기 할 수 있으며 통계 모델에는 노이즈 또는 오류 조건 등이 포함됩니다 (예측 이름에 관한 책도 있음)XYNate Silver 의 신호 및 잡음 ). 따라서 우리 는 모호한 임의성에 대한보다 정확한 동의어로 노이즈 를 사용 합니다 .

무작위 생성과 관련하여 Laplace 분포에 따라 임의의 값을 그리는 방법에는 여러 가지가 있습니다.

  1. 역변환 방법은 위키에 설명 :
f <- function(n) {
   u <- runif(n, -0.5, 0.5)
   sign(u)*log(1-2*abs(u))
}
  1. 경우 및 지수 분포 다음 독립 확률 변수이고, 다음 라플라스 분포를 따른다 :UVY=UV
g <- function(n) { rexp(n)-rexp(n) }
  1. 경우 라플라스 분포를 다음, 다음지수 분포를 따릅니다 .Y|Y|
h <- function(n) { rexp(n)*sample(c(-1,1), n, replace = TRUE) }

아래 그림에서 Laplace 밀도와 함께 각 함수를 사용하여 그린 샘플의 분포를 볼 수 있습니다 (빨간 선).105

여기에 이미지 설명을 입력하십시오

예제를 단순화하기 위해 scale = 1 인 표준 Laplace 분포를 사용하지만 다른 스케일링 계수를 사용하여 결과를 곱하여 결과를 쉽게 변경할 수 있습니다.


감사! 그것은 내 질문에 대한 답입니다. 나는 "노이즈"라는 용어에 대해 정말로 혼란 스러웠으며 적절한 설명을 찾을 수 없었습니다.
롯데

내 코드에 대한 히스토그램을 플로팅했으며 좋아 보인다 :)
Lotte

2

Laplace 또는 double exponential distribution은 평균에 따라 좌우로 기하 급수적으로 떨어집니다. 기본적으로 다른쪽에 지수가 반영됩니다.

  • 가능성을 원한다면 지수의 가능성을 사용하고 관측 값에 abs ()를 추가하십시오. 로그 우도는 단순히 잔차의 abs ()에 지수의 비율을 곱한 값입니다.

  • 표본 추출을 위해 가장 쉬운 방법은 -1,1을 사용하여 지수 분포를 사용하여 곱하는 것입니다. 대부분의 프로그래밍 언어에서 사용할 수 있습니다. 또는 위에서 언급 한 바와 같이 Laplace를 직접 구현할 수도 있지만 조금 더 검색해야 할 수도 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.