두 랜덤 변수의 합이 컨볼 루션 인 이유는 무엇입니까?


33

오랫동안 두 랜덤 변수의 "합계"가 컨볼 루션 인 이유를 이해하지 못한 반면 와 의 혼합 밀도 함수 합 은f(x)g(x)pf(x)+(1p)g(x); 그들의 컨볼 루션이 아닌 산술 합. 정확한 문구 "두 개의 임의 변수의 합"은 Google에 146,000 번 표시되며 다음과 같이 타원형입니다. 하나의 값을 산출하기 위해 RV를 고려한다면, 그 하나의 값을 다른 RV 단일 값에 더할 수 있는데, 이는 적어도 직접적으로는 아니고 컨볼 루션과는 아무런 관련이 없으며, 이는 모두 두 숫자의 합입니다. 그러나 통계의 RV 결과는 값의 모음이므로보다 정확한 문구는 "두 RV의 관련 개별 ​​값 쌍의 조정 된 합 집합이 이산 컨볼 루션"과 같은 것입니다. RV에 해당하는 밀도 함수의 컨볼 루션. 더 간단한 언어 : 2 RVn-샘플은 사실상 그들의 벡터 합으로 추가되는 2 개의 n- 차원 벡터이다.

두 랜덤 변수의 합이 컨볼 루션과 합인 방법에 대한 세부 사항을 표시하십시오.


6
나는 그것이 추상 대수적 의미 에서 '합계'라고 정말로 믿지 않습니다 . '변수의 합'을 만들 때 자연수 또는 실수를 추가 할 때 알 수있는 일반적인 산술 연산을 말합니다. 그것은 우리가 다른 변수들을 함께 더함으로써 새로운 변수를 만든다는 것을 의미합니다. '변수의 합'이라는 개념은 통계 영역 밖에 존재하며 컨볼 루션과 확률에 대한 표현과는 무관합니다. 그래서, 실제로 '변수의 합 이며 , 컨볼 루션'잘못된 것입니다. 그러나 아무도 이것을 암시하지 않습니다. 그 진술에서 'is'라는 단어를 바꿔야합니다.
Sextus Empiricus

5
이것은 를 '두 함수 f와 g의 곱'이라고해서는 안된다고 주장하는 것과 같다. 그 함수의 푸리에 변환의. f(x)g(x)
Sextus Empiricus

16
"알림"은 오해의 소지가 있습니다. 임의의 변수 와 의 합은 정확히 같은 의미로 "sum"은 학생에 의해 이해됩니다. 각 에 대해 숫자 추가하여 값 그리고그것에 대한 추상은 없습니다. 이 RV에는 분포가 있습니다. 분포를 나타내는 여러 가지 방법이 있습니다. 분포 함수 은 IS 회선 의 DFS의 및 ; 함수의 특성 은 IS 제품XYω(X+Y)(ω)X(ω)Y(ω).X+YXYX+Y그들의 CF의; 의 누적 생성 함수는 CGF 의 이며; 등등. X+Y
whuber

3
계산에 임의의 변수 또는 분포가 표시되지 않습니다.
whuber

8
내 게시물의 언어 stats.stackexchange.com/a/54894/919 에서 무작위 변수 쌍 는 각각 두 개의 숫자로 작성된 티켓 상자로 구성됩니다. 하나는 지정됩니다.(X,Y)X 와 다른Y. 이러한 임의 변수의 합은 각 티켓에서 찾은 두 개의 숫자를 추가하여 얻습니다. 계산은 말 그대로 3 학년 교실에 할당 할 수있는 작업입니다. (이 시점은 작업의 기본 단순성을 강조하고 모든 사람이 "의미"를 이해하는 것과 얼마나 강력하게 연결되어 있는지를 보여줍니다.)
whuber

답변:


14

랜덤 변수 분포와 관련된 컨벌루션 계산은 모두 총 확률 법칙의 수학적 표현입니다 .


내 게시물의 언어로 "무작위 변수"란 무엇입니까? ,

임의의 변수 쌍 (X,Y) 은 각각 하나의 지정된 X 와 다른 Y 두 숫자로 작성된 티켓 상자로 구성됩니다 . 이러한 임의 변수의 합은 각 티켓에서 찾은 두 개의 숫자를 추가하여 얻습니다.

나는 무작위 변수의 합이라는 개념을 Clarifying 에 그런 상자와 그 티켓의 그림을 올렸다 .

여기에 이미지 설명을 입력하십시오

이 계산은 말 그대로 3 학년 교실에 할당 할 수있는 작업입니다. (이 시점은 작업의 기본 단순성을 강조하고 모든 사람이 의미하는 "합"을 이해하는 것과 얼마나 강력하게 연결되어 있는지 보여줍니다.)

확률 변수의 합이 수학적으로 표현되는 방법은 상자의 내용을 나타내는 방법에 따라 다릅니다.

상자에 pmf, pdf 또는 mgf가 없을 수 있지만 항상 cdf, cf 및 cgf가있는 경우 이들 중 처음 두 개는 특별 합니다.


X, Y,X+YX+YzX+Yz,Pr(X+Y=z).

합계의 pmf는 총 확률의 법칙에 따라 티켓에 쓰여진 의 가치에 따라 티켓 세트를 세분하여 찾을 수 있습니다. 더 기술적으로X

박스의 분리 된 서브 세트 모음에서 발견 된 티켓의 비율은 개별 서브 세트의 비율의 합입니다.

따라서 다음과 같이 적용됩니다.

티켓의 비율 , 기록 모든 가능한 값을 통해 합 같아야는 티켓의 비율 및 기록X+Y=zPr(X+Y=z),xX=xX+Y=z,Pr(X=x,X+Y=z).

때문에 및 암시 이 표현은 원래의 변수의 관점에서 직접 재기록 될 수있는 및 로서X=xX+Y=zY=zx,XY

Pr(X+Y=z)=xPr(X=x,Y=zx).

이것이 컨볼 루션입니다.


편집하다

컨볼 루션은 임의의 변수의 합과 관련이 있지만 컨볼 루션은 임의의 변수 자체의 컨볼 루션이 아닙니다!

실제로 대부분의 경우 두 개의 임의 변수를 연관시킬 수 없습니다. 이것이 작동하려면 도메인에 추가적인 수학적 구조가 있어야합니다. 이 구조는 연속 토폴로지 그룹입니다.

세부 사항에 들어 가지 않고 두 함수 컨볼 루션 은 추상적으로 다음과 같아야 한다고 말하면 충분합니다X,Y:GH

(XY)(g)=h,kGh+k=gX(h)Y(k).

(합계는 통합이 될 수 있으며, 기존 변수에서 새로운 랜덤 변수를 생성 하려면 및 가 있을 때마다 를 측정 할 수 있어야합니다. 그러면 토폴로지 또는 측정 성을 고려해야합니다.)XYXY

이 수식은 두 가지 작업을 호출합니다. 하나는 에 대한 곱셈입니다 값 와 를 곱하는 것이 합리적이어야합니다 . 다른 하나는 대한 추가입니다 요소 를 추가하는 것이 합리적 입니다H:X(h)HY(k)H.G:G.

대부분의 확률 적용에서 는 일련의 숫자 (실수 또는 복소수)이며 곱셈이 일반적인 것입니다. 그러나 표본 공간 인 는 종종 수학적 구조를 갖지 않습니다. 그렇기 때문에 랜덤 변수의 컨볼 루션은 일반적으로 정의되지 않습니다. 이 스레드에서 컨볼 루션에 관련된 객체 는 랜덤 변수 분포의 수학적 표현입니다. 랜덤 변수의 결합 분포를 고려하여 임의의 변수 합계의 분포를 계산하는 데 사용됩니다.HG,


참고 문헌

Stuart and Ord, Kendall의 고급 통계 이론, 제 1 권. 1987 년 5 판, 1, 3, 4 장 ( 빈도 분포, 모멘트 및 누적특성 함수 ).


대수적 성질 로부터 스칼라 곱셈을 갖는 연관성 은 임의의 실수 (또는 복소수) 대해 와 관련 있습니다. 하나의 좋은 특성은 두 밀도 함수의 컨볼 루션이 밀도 함수라는 것입니다. 예를 들어, 강우 후 호수에서의 물 유출 처리, 투약 후 약물 농도 모델 등
a(fg)=(af)g
a
Carl

@Carl이 의견 은 임의의 변수의 합에 대해 묻는 원래의 질문과 어떻게 비교 됩니까? 기껏해야 접선입니다.
whuber

지나치게 일반화하지 말 것을 요청합니다. "RV의 컨볼 루션은"이라는 말없이 "컨볼 루션은"이라는 문장을 시작하는 것은 타원입니다. 여기서의 모든 문제는 타원 표기법이었습니다. 2 개의 공간 벡터 의 벡터 추가는 벡터의 정규화 여부에 관계없이 컨벌루션입니다. 만약 그들이 정규화된다면, 확률 일 필요는 없습니다. 그것은 단지 진실의 일부가 아니라 전체 진실입니다. n

감사합니다. 귀하의 질문에 답변하고 있음을 강조하기 위해 첫 번째 문장을 명확히하겠습니다.
whuber

기술적으로 내가 요청한 RV의 회선에 새로운 추가 기능이 적용됩니다. 그리고 아마도 혼란 스럽지만 컨볼 루션은 항상 RV의 것은 아니지만 스칼라가 곱하고 밀도 함수가 때때로 RV 인 밀도 함수보다 밀도 함수의 일부 스케일 요소로 항상 축소 될 수 있습니다. 곱셈의 정체성, 즉 1

41

표기법, 대문자 및 소문자

https://ko.wikipedia.org/wiki/Notation_in_probability_and_statistics

  • 랜덤 변수는 일반적으로 대문자 로마자 ( , 등)로 작성됩니다.XY
  • 랜덤 변수의 특정 실현은 해당 소문자로 작성됩니다. 예를 들어 , ,…, 은 랜덤 변수 해당하는 샘플 일 수 있으며 누적 확률은 공식적으로 로 작성 되어 랜덤 변수를 실현과 구별합니다.x1x2xnXP(X>x)

Z=X+Yzi=xi+yixi,yi


변수의 혼합-> PDF의 합

https://ko.wikipedia.org/wiki/Mixture_distribution

확률 (예 : Z)이 다른 확률 의 단일 합계로 정의 된 경우 확률 밀도 함수 및 합계를 사용합니다.fX1fX2

예를 들어 가 X 1에 의해 정의 된 시간 의 분수 s 이고 X 2에 의해 정의 된 시간 분수 1 - s 이면 P ( Z = z ) = s P ( X 1 = z ) + ( 1 s ) P ( X 2 = z )f Z ( z ) = s f XZsX11sX2

P(Z=z)=sP(X1=z)+(1s)P(X2=z)
fZ(z)=sfX1(z)+(1s)fX2(z)

. . . . 예를 들어 6면 주사위 또는 12면 주사위가있는 주사위 롤 중에서 선택할 수 있습니다. 한 주사위 또는 다른 주사위 시간의 50-50 %를한다고 가정 해 봅시다. 그런 다음

fmixedroll(z)=0.5f6sided(z)+0.5f12sided(z)


변수의 합-> PDF의 컨볼 루션

https://ko.wikipedia.org/wiki/Convolution_of_probability_distributions

확률 (예 : Z)이 서로 다른 (독립적) 확률의 여러 합으로 정의 된 경우 확률 밀도 함수 fX1fX2 의 회선을 사용합니다 .

예를 들어 Z=X1+X2 (즉, 합!) 이고 여러 개의 서로 다른 쌍 x1,x2 는 각각 확률 f x 1 ( x 1 ) f X 2 ( x 2 ) 와 함께 z 까지 합산합니다 . 그러면 컨벌루션 P ( Z = z ) = 모든 쌍  x 1 + x 2 = z P (fX1(x1)fX2(x2)

P(Z=z)=all pairs x1+x2=zP(X1=x1)P(X2=x2)

fZ(z)=x1 domain of X1fX1(x1)fX2(zx1)

또는 연속 변수

fZ(z)=x1 domain of X1fX1(x1)fX2(zx1)dx1

. . . . 예를 들어 두 개의 다이 롤의 합인 fX2(x)=fX1(x)=1/6x{1,2,3,4,5,6}

fZ(z)=x{1,2,3,4,5,6} and zx{1,2,3,4,5,6}fX1(x)fX2(zx)

참고 X 1  의 x1 domain of X1 을 통합하고 합치기로 선택하면 더 직관적이지만, 필요하지 않으며 도메인 외부에서 f X 1 ( x 1 ) = 0 을 정의하면 에서 까지 통합 할 수 있습니다 .fX1(x1)=0

이미지 예

'PDF의 컨볼 루션'을 초래하는 '변수 합계'의 예

ZX+Y 하자 . P 를 알기 위해 ( z - 1P(z12dz<Z<z+12dz)x,y의 모든 실현에 대한 확률을z-1로유도해야합니다.z12dz<Z=X+Y<z+12dz.

이것이 영역 ± 1 에서 f(x)g(y) 의 적분입니다.±12dz선을 따라x+y=z.


StackExchangeStrike에 의해 작성


6
@ 칼 그것은 전문 용어가 아닙니다. 회선은 실제로 많은 합계의 합계로 볼 수 있습니다. 그러나 이것은 '변수의 합'이 말하는 것이 아닙니다 . 그것은 우리가 일상 생활에서 (특히 보드 게임을 할 때) 매우 일반적인 의미와 해석을 갖는 '두 주사위 롤의 합'에 대해 말할 때와 같은 것을 말합니다. 두 개의 주사위 롤의 대수 합계를 사용할 때 두 개의 주사위 롤을 조합하여 사용한다고 말하고 싶습니까?
Sextus Empiricus

2
두 주사위 의 (단일) 합 으로 7을 굴릴 확률은 1-6, 2-5, 3-4, 4-3, 5-2, 6-1을 굴릴 확률 의 합계입니다 . 합이라는 용어는 번 발생 하며 첫 번째 경우 단일 합산 표현을 지칭 할 때 '두 개의 주사위 롤 합'과 같이 '두 변수의 합'이라는 문이 의미합니다.
Sextus Empiricus

5
실제로, 적분은 확률의 합을 대체합니다. 그러나, 즉,에 관한 용어 합 아니라 사용 첫번째 기간 합계의 사용. 따라서 우리는 여전히 두 가지 변수의 합계 (이 용어의 첫 번째 사용)를 참조 할 수 있습니다. 이는 'sum'이라는 용어가 확률의 컨벌루션 연산 또는 합산 연산을 나타내는 것이 아니라 변수의 합산을 나타내는 데 사용되기 때문입니다.
Sextus Empiricus

8
적어도 주사위 롤의 합에 대한 확률 밀도는 개별 주사위 롤에 대한 확률 밀도의 컨볼 루션에 의해 정의된다고 언급하는 것은 적어도 전문적인 것은 아니다. '주사위 롤의 합계'라는 용어는 전문 용어와 관련된 통계학자가없는 일상 생활에서 매우 정상적인 해석을합니다. 이런 의미에서 (주사위 롤의 합) 해석해야합니다 (변수의 합). 이 단계는 전문 용어가 아닙니다. 사람들은 항상 '변수의 합'을 사용합니다. 이 합계의 확률에 대해 생각하고 회선을 적용하기 시작하는 것은
통계학 자일뿐입니다.

2
@Carl : 내 말을 잘못 이해했다고 생각합니다. 여러분은 컨볼 루션 적분을 합이라고 부르는 것이 좋지 않다는 것을 말하고 있습니다. 이는 누군가가 컨볼 루션 적분을 합이라고 부릅니다. 그러나 여기 아무도이 말을하지 않습니다. 말한 것은 컨볼 루션 적분은 특정 변수의 합의 pdf입니다. 당신은 그 진술을 거짓으로 바꾸고 있었고, 그것이 거짓이라고 불평했습니다.

28

임의의 변수를 분포와 함께 나눠서 혼란을 일으키는 것 같습니다.

이 혼동을 "배우기"위해서는 몇 걸음 뒤로 물러서서 잠시 마음을 비우고 확률 공간과 시그마 대수와 같은 멋진 형식을 잊어 버리는 것이 도움이 될 수 있습니다. 그리고 그런 것들에 대해 들어 본 적이 없습니다!) 그리고 무작위 변수가 근본적으로 무엇을 나타내는 지 생각 하십시오 .

예를 들어, 내 손에 육면체 주사위가 있다고 가정 해 봅시다. (정말 그렇습니다. 실제로, 나는 그들의 전체 가방을 가지고 있습니다.) 나는 아직 그것을 굴리지 않았지만, 곧, 나는 아직 죽지 않은 숫자 를 전화로 결정합니다. 이름 " ".X

내가 이것에 대해 말할 수있는 , 없이 실제로 주사위를 압연하고 그 값을 결정? 글쎄, 나는 그 값이 7 또는 1 또는 1 이 아니라고 말할 수있다.X71 . 사실, 나는 그것이다이에 표시된 유일한 숫자이기 때문에16사이의 정수가 될 것이라고 확신 할 수 있습니다. 그리고 저는 평판이 좋은 제조사로부터이 주사위 봉지를 구입했기 때문에, 주사위를 굴려X가실제로어떤 숫자인지를 결정할 때, 그 가능한 6 가지 값 중 하나 일 가능성이 높습니다. 내가 결정할 수 있듯이.1216X

다시 말해, 내 는 집합 { 1 , 2 , 3 , 4 , 5 , 6 }에 균일하게 분포 된 정수 값의 랜덤 변수 입니다.X{1,2,3,4,5,6}


그러나 분명한 것은 분명합니다. 왜 당신이 이미 알고있는 사소한 것들을 계속해서 연구해야합니까? 또 다른 요점을 만들고 싶기 때문에 아직 중요 하지 않습니다. 아직 그 가치를 모르 더라도이 X로 수학을 수행 할 수 있습니다 !X

예를 들어, 주사위를 굴릴 숫자 에 1을 추가 하고 이름을 " Q "로 호출 할 수 있습니다. 나는 주사위를 굴릴 때까지 X 가 무엇인지 알지 못하기 때문에이 Q 가 어떤 숫자인지 알지 못하지만 QX 보다 하나 더 크 거나 수학 용어로 Q 라고 말할 수 있습니다. = X + 1 입니다.XQQXQXQ=X+1

그리고이 또한 그 값을 아직 모르기 때문에 랜덤 변수 가 될 것입니다 . 나는 그것이 X 보다 하나 더 클 것이라는 것을 알고 있습니다 . 그리고 X 가 취할 수 있는 가치 와 각 가치를 취할 가능성을 알고 있기 때문에 Q에 대한 것들도 결정할 수 있습니다 . 그리고 당신도 쉽게 충분히 할 수 있습니다. Q27 사이의 정수 이고 , (내 주사위가 생각보다 공정하고 균형이 잘 잡혀 있다고 가정 할 때) Q27 사이의 정수임을 알기 위해 멋진 형식주의 나 계산이 실제로 필요하지 않습니다. 그 값 중 하나.QXXQQ27

그러나 더 있습니다! 예를 들어, 주사위에 굴릴 숫자 을 곱하고 결과를 R = 3 X 라고 결정할 수 있습니다 . 그리고 이것은 또 다른 임의의 변수이며, 적분이나 회선 또는 추상 대수에 의존하지 않고도 분포도 알아낼 수 있습니다.XR=3X

정말 원한다면, 나는 심지어 아직 - 투 - 수 결정된 번호 취할 결정할 수 하고 배, 스핀들하고 자르다 2로 나누면, 그 하나를 빼고 그 결과를 광장. 그리고 결과 수 S = ( 1X는 또 다른 랜덤 변수입니다. 이번에는 정수 값이나 균일하게 분포되지는 않지만 기본 논리와 산술만으로도 분포를 쉽게 파악할 수 있습니다.S=(12X1)2


알 수없는 다이 롤 를 다양한 방정식 에 연결하여 새로운 랜덤 변수를 정의 할 수 있습니다 . 그래서 무엇? 내가 주사위 한 자루를 가지고 있다고 말했을 때 기억 나? 다른 것을 잡아서 " Y " 라는 이름 으로 주사위 를 굴릴 번호를 부릅니다 .XY

내가 가방에서 잡은 두 개의 주사위는 거의 동일합니다. 만약 내가 보이지 않을 때 그것들을 바꾸면 말할 수 없을 것입니다. 그래서이 X 와 같은 분포를 가질 것이라고 생각합니다. . 그러나 내가 정말로하고 싶은 것은 주사위를 굴려서 각각의 총 핍 수를 세는 것 입니다. 그리고 그 총 핍 수는 아직 모르기 때문에 임의의 변수이기도합니다 . " T "라고 부릅니다 .YXT

이 숫자 는 얼마나 클 까요? 음, 만약 X가 I가 제 1 다이 상에 롤 것이다 주사위의 수이고, Y는 I가 제 2 다이 상에 롤 것이다 주사위의 개수 후 T는 분명히 그 합, 즉 것이다 T = X + Y는 . 그리고 XY 가 1과 6 사이에 있기 때문에 T 는 적어도 2와 12가되어야합니다. 그리고 이후 XY가 모두 정수이다, T는 명확 아니라 정수 여야합니다.TXYTT=X+YXYTXYT


그러나 가 12와 12 사이의 가능한 값을 각각 가질 가능성은 얼마나 됩니까? 각각의 실험을 똑같이 수행 할 수있는 것은 아닙니다 . 약간의 실험을 통해 주사위 한 켤레에 주사위를 굴리는 것보다 일곱 개를 굴리는 것보다 훨씬 어렵다는 것을 알 수 있습니다 .T

이를 알아 내기 위해 Pr [ X = a ] 식으로 첫 번째 주사위 (결과가 X 라고 결정한 주사위)에서 숫자 를 굴릴 확률을 나타냅니다 . 마찬가지로, 나는 Pr [ Y = b ]에 의해 두 번째 다이 에서 숫자 b 를 굴릴 확률을 나타냅니다 . 물론 내 주사위가 완벽하고 균형이 잡힌다면 Pr [ X = a ] = Pr [ Y = b ] = 1aXPr[X=a]bPr[Y=b] 어떤을위한와B한 여섯 사이, 그러나 우리는뿐만 아니라 주사위가 실제로 바이어스 될 수 있고, 가능성이 다른 사람보다 몇 가지 숫자를 롤 더 일반적인 경우를 고려해 볼 수 있습니다.Pr[X=a]=Pr[Y=b]=16ab

두 개의 다이 롤 (I 확실히 부정하고 다른!에 따라 그 중 하나를 조절 계획하고 있지 않다) 독립적 때문에 이제, 확률은 내가 롤거야 첫 다이에 B 단순히 초에합니다 Pr [ X = a  및  Y = b ] = Pr [ X = a ] Pr [ Y = b ]의 확률의 곱이어야합니다 .a b

Pr[X=a and Y=b]=Pr[X=a]Pr[Y=b].

(위의 공식 은 독립적 인 무작위 변수 쌍에 대해서만 유지됩니다. 위의 Q바꾸면 확실히 유지되지 않습니다 .)YQ

이제 동일한 총 T를 산출 할 수 있는 몇 가지 가능한 Y 값이 있습니다 . 예를 들어, T = 4 에서 마찬가지로 잘 발생할 수 X = 1Y = 3 일부터 X = 2Y = 2 , 또는 심지어에서 X = 3Y = 1 . 그러나 이미 첫 번째 주사위를 굴 렸고 X 의 가치를 알고 있다면XYTT=4X=1Y=3X=2Y=2X=3Y=1X그런 다음 주어진 총 핍 수에 도달하기 위해 두 번째 주사위를 굴려야 할 값을 정확하게 말할 수 있습니다.

구체적으로, 어떤 숫자 c에 대해 확률에 관심이 있다고 가정 해 봅시다 . 이제 첫 번째 주사위를 굴린 후 X = a 임을 알고 있다면 두 번째 주사위에서 Y = c - a 를 굴려서 총 T = c 만 얻을 수 있습니다. 물론, 이미 전혀 주사위 압연없이 알고 있다는 선험적 압연 확률 제 1 다이 상 및 C - 제 2 다이에가 [ X =  및  YT=ccX=aT=cY=caaca

Pr[X=a and Y=ca]=Pr[X=a]Pr[Y=ca].

그러나 물론 첫 번째 주사위를 굴리는 결과에 따라 동일한 총 에 도달하는 여러 가지 방법이 있습니다 . 두 주사위에서 롤링 c pips 의 총 확률 Pr [ T = c ] 를 얻으려면, 그 총계를 굴릴 수있는 모든 다른 방법의 확률을 더해야합니다. 예를 들어, 두 주사위에 총 4 핍을 굴릴 확률은 다음과 같습니다. Pr [ T = 4 ] = Pr [ X = 1 ] Pr [ Y = 3 ] + Pr [cPr[T=c]c

Pr[T=4]=Pr[X=1]Pr[Y=3]+Pr[X=2]Pr[Y=2]+Pr[X=3]Pr[Y=1]+Pr[X=4]Pr[Y=0]+

위의 합계로 너무 멀리 갔다는 점에 유의하십시오. 확실히 0 일 수 없습니다 ! 그러나 수학적으로 문제가되지 않습니다. 우리는 단지 같은 불가능한 사건의 확률을 정의 할 필요가 Y = 0 (또는 Y = 7 또는 Y = - 1 또는 Y = 1Y0Y=0Y=7Y=1 )는 0입니다. 그러면 두 개의 다이 롤 (또는 일반적으로 두 개의 독립적 인 정수 값 임의 변수)의 합을 분포시키는 일반적인 공식을 얻게됩니다.Y=12

T=X+YPr[T=c]=aZPr[X=a]Pr[Y=ca].

그리고 "convolution"이라는 단어를 언급하지 않고도 박람회를 완벽하게 막을 수있었습니다! 그러나 물론 이산 컨볼 루션 이 어떻게 보이는지 알게되면 위의 공식에서 하나를 인식 할 수 있습니다. : 그리고 그 위에 파생 된 초등학교 결과 진술 중 하나 상당히 진보 된 방법 확률 질량 함수를 두 정수 값 확률 변수의 합은 피가수의 확률 질량 함수의 이산 회선된다.

물론, 합을 적분 및 확률 질량으로 확률 밀도 로 대체함으로써 , 연속 분포 된 랜덤 변수에 대해서도 유사한 결과를 얻습니다. 그리고 충분히 회선의 정의를 스트레칭함으로써, 우리는 심지어 그것을 적용 할 수 있는 모든 그 시점에서 수식 거의 동어 반복되고 있지만, 우리는 꽤 많이해야하기 때문에 단지 -에 관계없이 분포, 확률 변수 정의 두 회선을 임의의 확률 분포는 두 분포에 대한 두 개의 독립적 인 랜덤 변수의 합의 분포입니다.

그럼에도 불구하고 컨볼 루션과 분포, PMF 및 PDF가있는이 모든 것은 실제로 임의 변수에 대한 것을 계산하기위한 도구 세트 일뿐 입니다. 우리가 물건을 계산하고 있다는 기본적인 객체 에 대해 정말 그냥있는 확률 변수 자체입니다 값을 우리가하지 않도록에 대한 것 번호 .

게다가, 그 컨볼 루션 트릭 은 임의의 변수의 대해서만 작동 합니다. 예를 들어 U = X Y 또는 V = X Y 의 분포를 알고 싶다면 기본 방법을 사용하여 계산해야하며 결과는 회선 이 아닙니다 .U=XYV=XY


부록 : 합계 / 곱 / 지수 / 두 랜덤 변수의 조합에 관계없이 합계의 분포를 계산하기위한 일반 공식을 원한다면 다음 중 하나를 작성하는 방법이 있습니다. 여기서 는 임의의 이진수 연산을 나타내고 [ a = b c ]Iverson 괄호, 즉 [ a = b c ] = { a = 1 인 경우 

A=BCPr[A=a]=b,cPr[B=b and C=c][a=bc],
[a=bc]
[a=bc]={1if a=bc, and0otherwise.

(비 이종 랜덤 변수에 대해이 공식을 일반화하는 것은 대부분 무의미한 형식주의의 연습으로 남아 있습니다. 이산 사례는 본질적인 아이디어를 설명하기에 충분합니다. 비 이종 사례는 단지 관련이없는 복잡한 문제를 추가합니다.)

이 공식이 실제로 덧셈에 효과가 있는지, 그리고 두 개의 독립적 인 랜덤 변수 를 추가하는 특별한 경우에는 이전에 주어진 "convolution"공식과 동등 하다는 것을 스스로 확인할 수 있습니다 .

물론 실제로이 일반 수식은 하나가 아닌 두 개의 무제한 변수에 대한 합계를 포함하므로 계산에 훨씬 유용 하지 않습니다. 그러나 단일 합계 공식과는 달리 두 개의 임의 변수, 임의의 불가역 변수의 임의 함수에 대해 작동 하며, 역으로 위장하는 대신 연산 를 명시 적으로 보여줍니다 (예 : "convolution"공식은 덧셈으로 덧셈을 가장합니다) ).


추신. 방금 주사위를 굴 렸습니다. 그것이 나오는 것을 Y = 6 것을 의미, Q = 6 , R = 15 , S = 2.25 , T = 11 , U가 = 30V = 15,625 . 이제 알 잖아 ;-)X=5Y=6Q=6R=15S=2.25T=11U=30V=15625


4
이것이 정답입니다! 매우 직관적이고 명확합니다!
Vladislavs Dovgalecs 1

3
@Carl : 내가 만들려고 점은 합이다 임의의 변수가 참으로 단순한 합이다 : . 우리가 계산하고자하는 경우 유통T를 , 우리는 더 복잡한 일을 수행해야합니다,하지만 두 번째 문제입니다. 랜덤 변수는 분포가 아닙니다. (실제로, 변수의 분포는 (변수) 분포만으로는 다른 변수와의 가능한 의존성에 대한 정보를 인코딩하지 않기 때문에 분포에 의해 완전히 특징 T=X+YT
지워지지 않습니다

3
@Carl : ... 어쨌든 "임의 변수 추가"에 대한 특수 기호를 도입하려면 일관성을 위해 "임의 변수의 곱셈"및 "임의 변수의 분할"에 대한 특수 기호가 있어야합니다. "임의 변수의 지수화"및 "임의 변수의 로그"등. 이러한 모든 연산은 임의의 변수에 완벽하게 정의 되어 있으며 불확실한 값을 가진 숫자로 볼 수 있지만 모든 경우 에 결과 분포 를 계산하는 것은 상수에 대한 해당 계산을 수행하는 것보다 훨씬 더 복잡합니다.
Ilmari Karonen

5
@Carl : 분포와 랜덤 변수의 혼동을 멈 추면 혼란이 사라집니다. 랜덤 변수의 분포를 취하는 것은 의미있는 의미에서 선형 연산이 아니므로 두 랜덤 변수의 합계의 분포는 (일반적으로) 분포의 합계가 아닙니다. 그러나 비선형 연산 에서도 마찬가지입니다 . 확실히 당신은 , 그렇다면 왜Pr[X+Y=c]Pr[X=c]+Pr[Y=c]라는 사실에 혼동해야합니까? x+yx+yPr[X+Y=c]Pr[X=c]+Pr[Y=c]
Ilmari Karonen

3
@ 칼 : 잠깐만 요? 주사위 두 개를 굴려서 결과 Y 를 적고 Z = X / Y 를 계산 합니다. 그것은 어떻게 일반적인 분열이 아닙니까? (그렇습니다 . 주사위를 굴리기 전에 하더라도 여전히 정상적인 분할 입니다.이 경우 XY 의 값은 아직 고정되어 있지 않으므로 Z 의 값도 아닙니다 .)XYZ=X/YXYZ
Ilmari Karonen

7

사실 나는 당신을 오해하지 않는 한 이것이 옳다고 생각하지 않습니다.

XY

p(X+Y)=p(X)p(Y)
XY

X=xS=X+YYxXSp(X)p(Y)

p(S)=pY(Sx)pX(x)dx
p(S)=pX(Sy)pY(y)dy

XYXYXYS=X+YXYXY


많은 합계를 합산하는 것이 '+'기호로 표시 할 가치가있는 단일 합계보다 더 결합 됩니다. 임의의 변수 가 컨벌루션으로 결합 된다는 것을 선호 합니다.
Carl

6
컨볼 루션은 많은 합계의 합이라고 할 수 있습니다. 그러나 이해해야 할 것은 컨볼 루션 은 합산되는 변수의 PDF 에만 엄격하게 적용 된다는 것입니다. 변수 자체는 복잡 하지 않습니다 . 그것들은 단지 하나에 다른 것으로 추가되며, 더하기를 컨볼 루션 연산으로 해석 할 방법이 없습니다 (따라서 질문의 기본 전제는 정확하지 않습니다).
Ruben van Bergen

4
당신은 그 참조를 오해하고 있습니다. 이 상태 : 둘 개 이상의 독립 확률 변수의 합 확률 분포가 개별 분포 컨벌루션 . 두 개의 임의 변수의 합이 해당 변수를 모으는 것과 같다고 말하지는 않습니다. 그것은 말한다 분포 합은 컨볼 루션의 분포 각 변수. 랜덤 변수와 그 분포는 서로 다른 두 가지입니다.
Ruben van Bergen

물론, 임의의 변수를 연관 시킬 수 있습니다 . 그러나 그 기사에서 (그리고 위의 대답에서) 널리 알려져 있고 논의 된 합 / 회선 속성 은 임의 변수의 회선을 다루지 않습니다 . 이는 특별히 우려된다 랜덤 변수, 그리고 합에 대한 분포의 특성.
Ruben van Bergen

1
( "임의의 변수를 연관시킬 수 있습니다."당신은 이해할 수 있습니까? 무작위 변수의 합의 분포 함수를 얻기 위해서는 각각의 질량 / 밀도 함수를 연관 짓기 때문에 많은 사람들이 서로 다른 분포에 대해 이야기합니다. 확률 변수를 컨볼 루션의 (잘못) 어떤 이야기 죄송합니다 빗나가에,하지만 난 호기심)입니다..
Scortchi - 분석 재개 모니카

6

XωYS=X+YSXY

S=X+Y

S=X+YXYX+YX convoluted with Y+X+Y

+X+YX(ω)+Y(ω)+sin(θ)+cos(θ)


[이 답변은 단지 @MartijnWeterings, @IlmariKaronen, @RubenvanBergen 및 @whuber의 답변과 의견에 간결하게 포인트를 모 으려고합니다. 컨볼 루션이 아닌 임의 변수가 무엇인지 설명하는 방향에서 오는 것이 도움이 될 것이라고 생각했습니다. 모두 감사합니다!]


(+1) 노력하십시오. 나를 위해 너무 깊이 대답하십시오. 그러나 그것은 나를 하나로 이끌었습니다. 그것을 읽고 당신의 생각을 알려주십시오.
Carl

Si=Xi+Yii=1,2,3,...,n1,n

XYSsin(θ)+cos(ϕ)+

sin(θ)sin(θ)+cos(ϕ)

1
@Carl : (1) 생물학자가 모델 번호를 모델링 한 경우. 계란은 Poisson rv로 오리의 둥지에 놓여 있으며, 계란의 무한한 가능성을 실제로 계산하지는 않습니다. 수학에서 무한 세트의 역할에 대해 궁금한 점이 있으면 수학 또는 철학 SE에 문의하십시오. (2) 상당히 표준이지만, 명명법은 실제로 오도 할 수있다. 따라서 내 대답.
Scortchi – 복원 Monica Monica

3

"알림"에 대한 응답으로 음 ..

XYZZ=X+YZXY=ZX

P(Z=z)=P(X=x)P(Y=zx)dx.

통지가 사라졌습니다. 돌보는 당신에게 (+1).
Carl

2

그 이유는 전력 기능의 곱이 회선과 관련되어 있기 때문입니다. 범위 (예 : 두 가지 전력 함수의 거듭 제곱 또는 PDF 범위)가 있고 새 범위가 원래 범위의 합으로 표시되는 개체를 결합하면 컨볼 루션은 항상 자연스럽게 나타납니다.

x+y

컨볼 루션 공식을 보면 (이산 값의 경우 더 쉽게 볼 수 있기 때문에)

(fg)(n)=kf(k)g(nk)

nkkn

전력 기능을 위해

(a0+a1x1+a2x2++anxn)(b0+b1x1+b2x2++bmxm)=i=0m+nkakbikxi

항상 같은 합계를 얻기 위해 왼쪽의 높은 지수와 오른쪽의 낮은 지수를 결합하거나 그 반대로 동일한 패턴을 갖습니다.

일단 컨볼 루션이 실제로 무엇을하고 있는지, 즉 어떤 용어가 결합되고 있는지, 그리고 왜 여러 곳에 나타나야하는지, 랜덤 변수를 변화시키는 이유는 분명 해져야합니다.


2

n

그린 넬 CM, 스넬 JL. 확률 소개 : American Mathematical Soc .; 2012. Ch. 7, 운동 1 :

XYfX(x)fY(y)X+YfX(x)fY(y)

Z(X,Y)ZfX(x)fY(y)XYX+YzZ

FZ(z)=P(X+Yz)=(x,y):x+yzfX(x)fY(y)dydx
=fX(x)[yzxfY(y)dy]dx=fX(x)[FY(zx)]dx.

zz

fZ(z)=dFZ(z)dz=fX(x)fY(zx)dx.

xxxx1+x2x-값. 이러한 유형의 덧셈을 여러 번 반복하면 합의 결과 밀도 (결과 밀도)가 개별 밀도의 컨벌루션 PDF로 경향이 있습니다. 전체 정보 손실로 인해 구성 PDF (또는 summand)와 비교하여 컨볼 루션 (또는 합계)의 평활화 (또는 밀도 분산)가 발생합니다. 또 다른 효과는 컨벌루션 (또는 합계)의 위치 이동입니다. 여러 요소의 실현 (결과, 인스턴스)은 연속적인 샘플 공간을 채우는 (예시적인) 희소 요소 만 제공합니다.

예를 들어, 모양이 이고 스케일이 감마 분포를 사용하여 1000 개의 임의 값이 만들어졌습니다 . 이것들은 평균이 4이고 표준 편차가 정규 분포에서 1000 개의 난수 값에 쌍으로 추가되었습니다 . 3 개의 값 그룹 각각의 밀도 스케일 히스토그램을 랜덤 데이터를 생성하기 위해 사용 된 밀도 함수 및 밀도 함수의 컨볼 루션 (convolution)과 함께 공동 플로팅하고 (아래 왼쪽 패널), 대조 (아래 오른쪽 패널) 하였다. 10/921/4여기에 이미지 설명을 입력하십시오

그림에서 볼 수 있듯이 왼쪽 패널의 커널 평활 데이터 분포 (빨간색)가 연속 밀도 함수 및 오른쪽 패널의 컨볼 루션과 유사하므로 summands 설명 추가가 그럴듯 해 보입니다.


@ whuber 마지막으로, 나는 이해한다고 생각합니다. 합계는 임의의 이벤트입니다. 내 설명을보고 지금 분명한지 말해주세요.
Carl

3
언어에주의를 기울이는 데 도움이됩니다. 이벤트가 설정 됩니다. 그들은 심지어 숫자의 집합조차도 드물다 (그러므로 그들의 요소가 "결과"라고 불린다). 이벤트는 추가되지 않습니다. 랜덤 변수의 값이 그러합니다. "감동적으로 복잡한"문제는 산만하다. 실제로, 문제의 핵심에 도달하려면 예제의 summands 중 하나가 평균 제로 평균 랜덤 변수인지 확인하십시오. 평균은 위치의 전체 이동에 영향을 미치기 때문입니다. 당신은 회선이 무엇을 직관적으로 이해하려는 다른 이동 위치보다.
whuber

@ whuber 감사합니다. 통계적으로 만 결과는 샘플 공간의 단일 요소입니다. 우리의 나머지 부분에 대한 결과는 이벤트의 결과입니다. 스무딩 및 쉬프팅. 내가 보여주는 것은 중첩 된 플롯의 충돌을 줄이기 때문에 가장 혼란스러운 예입니다.
Carl

1
이제 혼합 모델에 대해 어떻게 생각하는지 봅니다. 때때로 "멀티 세트"라고 알려진 것을 구성하고 있습니다. (일반적으로 생성자 브래킷 이외 표기법을 명확히하기 위해 사용된다.) 아이디어는 경험적 분포 함수의 그 것처럼 보인다 : multiset의의 경험적 분포 및 MULTISET의 경험적 분포 탄력성을 상대 가중치를 갖는 두 분포의 혼합 인 다중 집합 조합의 경험적 분포로 상승그리고{,}AB|A||B|.
whuber

1
이 진행중인 편집에서 혼란의 근원을 발견했다고 생각합니다. 의견에 설명하는 데 시간이 너무 오래 걸리기 때문에 약간의 도움이되기를 바랍니다. 사실, 내 대답의 첫 번째 줄은 그 계정에서 오도 된 것이므로 사과로도 고쳤습니다.
whuber

1

이 질문은 오래되었지만 또 다른 관점을 제시하고 싶습니다. 관절 확률 밀도의 변수 변화에 대한 공식을 기반으로합니다. 2017 년 KTH 강의 노트 : 확률과 랜덤 프로세스에서 찾을 수 있습니다 . (Koski, T., 2017, pp 67), 그 자체는 Analysens Grunder, del 2 (Neymark, M., 1970, pp 148-168) 의 자세한 증거를 나타냅니다 .


랜덤 벡터 이 결합 pdf . 다음과 같이 새로운 랜덤 벡터 을 정의하십시오X=(X1,X2,...,Xm)fX(x1,x2,...,xm)Y=(Y1,Y2,...,Ym)

Yi=gi(X1,X2,...,Xm),i=1,2,...,m

여기서 는 지속적으로 있으며 은 역수와 관계입니다.gi(g1,g2,...,gm)

Xi=hi(Y1,Y2,...,Ym),i=1,2,...,m

그런 다음 의 공동 pdf는 (무기한 영역에서)Y

fY(y1,y2,...,ym)=fX(h1(x1,x2,...,xm),h2(x1,x2,...,xm),...,hm(x1,x2,...,xm))|J|

여기서 는 자 코비안 결정자입니다.J

J=|x1y1x1y2...x1ymx2y1x2y2...x2ymxmy1xmy2...xmym|


이제이 공식을 적용하여 irvs 의 합의 pdf를 구합니다 :X1+X2

조인트 pdf 랜덤 벡터 를 정의하십시오 . 다음으로 임의 벡터 를X=(X1,X2)fX(x1,x2)Y=(Y1,Y2)

Y1=g1(X1,X2)=X1+X2Y2=g2(X1,X2)=X2.

그러면 역지도는

X1=h1(Y1,Y2)=Y1Y2X2=h2(Y1,Y2)=Y2.

따라서 이것과 과 가 독립적 이라는 가정 때문에 의 공동 pdf 는X1X2Y

fY(y1,y2)=fX(h1(y1,y2),h2(y1,y2))|J|=fX(y1y2,y2)|J|=fX1(y1y2)fX2(y2)|J|

Jacobian 가 있는 곳J

J=|x1y1x1y2x2y1x2y2|=|1101|=1

의 pdf를 찾으려면 주 변화하지 않습니다Y1=X1+X2

fY1=fY(y1,y2)dy2=fX(h1(y1,y2),h2(y1,y2))|J|dy2=fX1(y1y2)fX2(y2)dy2

우리가 당신의 컨볼 루션을 찾는 곳은 어디입니까? : D


0

n 개의 연속 랜덤 변수의 합계에 대한 일반 표현식은 다음과 같습니다.

https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0216422

"복잡한 시스템의 고장, 계단식 재난 및 질병의 발병을위한 다단계 모델"

양의 랜덤 변수의 경우 합은 간단히 Laplace 변환 곱과 곱의 곱으로 간단히 작성할 수 있습니다. 이 방법은 ET Jaynes "Probability Theory"교재에 나타난 계산에서 채택되었습니다.


우리 사이트에 오신 것을 환영합니다. stats.stackexchange.com/questions/72479 및 스레드가 참조하는 Moschopolous 논문 에서 스레드 가 관심을 가질 수 있습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.