임의의 변수를 분포와 함께 나눠서 혼란을 일으키는 것 같습니다.
이 혼동을 "배우기"위해서는 몇 걸음 뒤로 물러서서 잠시 마음을 비우고 확률 공간과 시그마 대수와 같은 멋진 형식을 잊어 버리는 것이 도움이 될 수 있습니다. 그리고 그런 것들에 대해 들어 본 적이 없습니다!) 그리고 무작위 변수가 근본적으로 무엇을 나타내는 지 생각 하십시오 .
예를 들어, 내 손에 육면체 주사위가 있다고 가정 해 봅시다. (정말 그렇습니다. 실제로, 나는 그들의 전체 가방을 가지고 있습니다.) 나는 아직 그것을 굴리지 않았지만, 곧, 나는 아직 죽지 않은 숫자 를 전화로 결정합니다. 이름 " ".X
내가 이것에 대해 말할 수있는 , 없이 실제로 주사위를 압연하고 그 값을 결정? 글쎄, 나는 그 값이 7 또는 − 1 또는 1 이 아니라고 말할 수있다.X7−1 . 사실, 나는 그것이다이에 표시된 유일한 숫자이기 때문에1과6사이의 정수가 될 것이라고 확신 할 수 있습니다. 그리고 저는 평판이 좋은 제조사로부터이 주사위 봉지를 구입했기 때문에, 주사위를 굴려X가실제로어떤 숫자인지를 결정할 때, 그 가능한 6 가지 값 중 하나 일 가능성이 높습니다. 내가 결정할 수 있듯이.1216X
다시 말해, 내 는 집합 { 1 , 2 , 3 , 4 , 5 , 6 }에 균일하게 분포 된 정수 값의 랜덤 변수 입니다.X{1,2,3,4,5,6}
그러나 분명한 것은 분명합니다. 왜 당신이 이미 알고있는 사소한 것들을 계속해서 연구해야합니까? 또 다른 요점을 만들고 싶기 때문에 아직 중요 하지 않습니다. 아직 그 가치를 모르 더라도이 X로 수학을 수행 할 수 있습니다 !X
예를 들어, 주사위를 굴릴 숫자 에 1을 추가 하고 이름을 " Q "로 호출 할 수 있습니다. 나는 주사위를 굴릴 때까지 X 가 무엇인지 알지 못하기 때문에이 Q 가 어떤 숫자인지 알지 못하지만 Q 는 X 보다 하나 더 크 거나 수학 용어로 Q 라고 말할 수 있습니다. = X + 1 입니다.XQQXQXQ=X+1
그리고이 는 또한 그 값을 아직 모르기 때문에 랜덤 변수 가 될 것입니다 . 나는 그것이 X 보다 하나 더 클 것이라는 것을 알고 있습니다 . 그리고 X 가 취할 수 있는 가치 와 각 가치를 취할 가능성을 알고 있기 때문에 Q에 대한 것들도 결정할 수 있습니다 . 그리고 당신도 쉽게 충분히 할 수 있습니다. Q 가 2 와 7 사이의 정수 이고 , (내 주사위가 생각보다 공정하고 균형이 잘 잡혀 있다고 가정 할 때) Q 가 2 와 7 사이의 정수임을 알기 위해 멋진 형식주의 나 계산이 실제로 필요하지 않습니다. 그 값 중 하나.QXXQQ27
그러나 더 있습니다! 예를 들어, 주사위에 굴릴 숫자 을 곱하고 결과를 R = 3 X 라고 결정할 수 있습니다 . 그리고 이것은 또 다른 임의의 변수이며, 적분이나 회선 또는 추상 대수에 의존하지 않고도 분포도 알아낼 수 있습니다.XR=3X
정말 원한다면, 나는 심지어 아직 - 투 - 수 결정된 번호 취할 결정할 수 하고 배, 스핀들하고 자르다 2로 나누면, 그 하나를 빼고 그 결과를 광장. 그리고 결과 수 S = ( 1X는 또 다른 랜덤 변수입니다. 이번에는 정수 값이나 균일하게 분포되지는 않지만 기본 논리와 산술만으로도 분포를 쉽게 파악할 수 있습니다.S=(12X−1)2
알 수없는 다이 롤 를 다양한 방정식 에 연결하여 새로운 랜덤 변수를 정의 할 수 있습니다 . 그래서 무엇? 내가 주사위 한 자루를 가지고 있다고 말했을 때 기억 나? 다른 것을 잡아서 " Y " 라는 이름 으로 그 주사위 를 굴릴 번호를 부릅니다 .XY
내가 가방에서 잡은 두 개의 주사위는 거의 동일합니다. 만약 내가 보이지 않을 때 그것들을 바꾸면 말할 수 없을 것입니다. 그래서이 도 X 와 같은 분포를 가질 것이라고 생각합니다. . 그러나 내가 정말로하고 싶은 것은 주사위를 굴려서 각각의 총 핍 수를 세는 것 입니다. 그리고 그 총 핍 수는 아직 모르기 때문에 임의의 변수이기도합니다 . " T "라고 부릅니다 .YXT
이 숫자 는 얼마나 클 까요? 음, 만약 X가 I가 제 1 다이 상에 롤 것이다 주사위의 수이고, Y는 I가 제 2 다이 상에 롤 것이다 주사위의 개수 후 T는 분명히 그 합, 즉 것이다 T = X + Y는 . 그리고 X 와 Y 가 1과 6 사이에 있기 때문에 T 는 적어도 2와 12가되어야합니다. 그리고 이후 X 와 Y가 모두 정수이다, T는 명확 아니라 정수 여야합니다.TXYTT=X+YXYTXYT
그러나 가 12와 12 사이의 가능한 값을 각각 가질 가능성은 얼마나 됩니까? 각각의 실험을 똑같이 수행 할 수있는 것은 아닙니다 . 약간의 실험을 통해 주사위 한 켤레에 주사위를 굴리는 것보다 일곱 개를 굴리는 것보다 훨씬 어렵다는 것을 알 수 있습니다 .T
이를 알아 내기 위해 Pr [ X = a ] 식으로 첫 번째 주사위 (결과가 X 라고 결정한 주사위)에서 숫자 를 굴릴 확률을 나타냅니다 . 마찬가지로, 나는 Pr [ Y = b ]에 의해 두 번째 다이 에서 숫자 b 를 굴릴 확률을 나타냅니다 . 물론 내 주사위가 완벽하고 균형이 잡힌다면 Pr [ X = a ] = Pr [ Y = b ] = 1aXPr[X=a]bPr[Y=b] 어떤을위한와B한 여섯 사이, 그러나 우리는뿐만 아니라 주사위가 실제로 바이어스 될 수 있고, 가능성이 다른 사람보다 몇 가지 숫자를 롤 더 일반적인 경우를 고려해 볼 수 있습니다.Pr[X=a]=Pr[Y=b]=16ab
두 개의 다이 롤 (I 확실히 부정하고 다른!에 따라 그 중 하나를 조절 계획하고 있지 않다) 독립적 때문에 이제, 확률은 내가 롤거야 첫 다이에 와 B 단순히 초에합니다 Pr [ X = a 및 Y = b ] = Pr [ X = a ] Pr [ Y = b ]의 확률의 곱이어야합니다 .a b
Pr[X=a and Y=b]=Pr[X=a]Pr[Y=b].
(위의 공식 은 독립적 인 무작위 변수 쌍에 대해서만 유지됩니다. 위의 Q 로 바꾸면 확실히 유지되지 않습니다 .)YQ
이제 동일한 총 T를 산출 할 수 있는 몇 가지 가능한 및 Y 값이 있습니다 . 예를 들어, T = 4 에서 마찬가지로 잘 발생할 수 X = 1 및 Y = 3 일부터 X = 2 및 Y = 2 , 또는 심지어에서 X = 3 및 Y = 1 . 그러나 이미 첫 번째 주사위를 굴 렸고 X 의 가치를 알고 있다면XYTT=4X=1Y=3X=2Y=2X=3Y=1X그런 다음 주어진 총 핍 수에 도달하기 위해 두 번째 주사위를 굴려야 할 값을 정확하게 말할 수 있습니다.
구체적으로, 어떤 숫자 c에 대해 확률에 관심이 있다고 가정 해 봅시다 . 이제 첫 번째 주사위를 굴린 후 X = a 임을 알고 있다면 두 번째 주사위에서 Y = c - a 를 굴려서 총 T = c 만 얻을 수 있습니다. 물론, 이미 전혀 주사위 압연없이 알고 있다는 선험적 압연 확률 를 제 1 다이 상 및 C - 제 2 다이에가 잠 [ X = 및 YT=ccX=aT=cY=c−aac−a
Pr[X=a and Y=c−a]=Pr[X=a]Pr[Y=c−a].
그러나 물론 첫 번째 주사위를 굴리는 결과에 따라 동일한 총 에 도달하는 여러 가지 방법이 있습니다 . 두 주사위에서 롤링 c pips 의 총 확률 Pr [ T = c ] 를 얻으려면, 그 총계를 굴릴 수있는 모든 다른 방법의 확률을 더해야합니다. 예를 들어, 두 주사위에 총 4 핍을 굴릴 확률은 다음과 같습니다. Pr [ T = 4 ] = Pr [ X = 1 ] Pr [ Y = 3 ] + Pr [cPr[T=c]c
Pr[T=4]=Pr[X=1]Pr[Y=3]+Pr[X=2]Pr[Y=2]+Pr[X=3]Pr[Y=1]+Pr[X=4]Pr[Y=0]+…
위의 합계로 너무 멀리 갔다는 점에 유의하십시오. 확실히 는 0 일 수 없습니다 ! 그러나 수학적으로 문제가되지 않습니다. 우리는 단지 같은 불가능한 사건의 확률을 정의 할 필요가 Y = 0 (또는 Y = 7 또는 Y = - 1 또는 Y = 1Y0Y=0Y=7Y=−1 )는 0입니다. 그러면 두 개의 다이 롤 (또는 일반적으로 두 개의 독립적 인 정수 값 임의 변수)의 합을 분포시키는 일반적인 공식을 얻게됩니다.Y=12
T=X+Y⟹Pr[T=c]=∑a∈ZPr[X=a]Pr[Y=c−a].
그리고 "convolution"이라는 단어를 언급하지 않고도 박람회를 완벽하게 막을 수있었습니다! 그러나 물론 이산 컨볼 루션 이 어떻게 보이는지 알게되면 위의 공식에서 하나를 인식 할 수 있습니다. : 그리고 그 위에 파생 된 초등학교 결과 진술 중 하나 상당히 진보 된 방법 확률 질량 함수를 두 정수 값 확률 변수의 합은 피가수의 확률 질량 함수의 이산 회선된다.
물론, 합을 적분 및 확률 질량으로 확률 밀도 로 대체함으로써 , 연속 분포 된 랜덤 변수에 대해서도 유사한 결과를 얻습니다. 그리고 충분히 회선의 정의를 스트레칭함으로써, 우리는 심지어 그것을 적용 할 수 있는 모든 그 시점에서 수식 거의 동어 반복되고 있지만, 우리는 꽤 많이해야하기 때문에 단지 -에 관계없이 분포, 확률 변수 정의 두 회선을 임의의 확률 분포는 두 분포에 대한 두 개의 독립적 인 랜덤 변수의 합의 분포입니다.
그럼에도 불구하고 컨볼 루션과 분포, PMF 및 PDF가있는이 모든 것은 실제로 임의 변수에 대한 것을 계산하기위한 도구 세트 일뿐 입니다. 우리가 물건을 계산하고 있다는 기본적인 객체 에 대해 정말 그냥있는 확률 변수 자체입니다 값을 우리가하지 않도록에 대한 것 번호 .
게다가, 그 컨볼 루션 트릭 은 임의의 변수의 합 에 대해서만 작동 합니다. 예를 들어 U = X Y 또는 V = X Y 의 분포를 알고 싶다면 기본 방법을 사용하여 계산해야하며 결과는 회선 이 아닙니다 .U=XYV=XY
부록 : 합계 / 곱 / 지수 / 두 랜덤 변수의 조합에 관계없이 합계의 분포를 계산하기위한 일반 공식을 원한다면 다음 중 하나를 작성하는 방법이 있습니다. 여기서 ⊙ 는 임의의 이진수 연산을 나타내고 [ a = b ⊙ c ] 는Iverson 괄호, 즉 [ a = b ⊙ c ] = { a = 1 인 경우
A=B⊙C⟹Pr[A=a]=∑b,cPr[B=b and C=c][a=b⊙c],
⊙[a=b⊙c][a=b⊙c]={10if a=b⊙c, andotherwise.
(비 이종 랜덤 변수에 대해이 공식을 일반화하는 것은 대부분 무의미한 형식주의의 연습으로 남아 있습니다. 이산 사례는 본질적인 아이디어를 설명하기에 충분합니다. 비 이종 사례는 단지 관련이없는 복잡한 문제를 추가합니다.)
이 공식이 실제로 덧셈에 효과가 있는지, 그리고 두 개의 독립적 인 랜덤 변수 를 추가하는 특별한 경우에는 이전에 주어진 "convolution"공식과 동등 하다는 것을 스스로 확인할 수 있습니다 .
물론 실제로이 일반 수식은 하나가 아닌 두 개의 무제한 변수에 대한 합계를 포함하므로 계산에 훨씬 유용 하지 않습니다. 그러나 단일 합계 공식과는 달리 두 개의 임의 변수, 임의의 불가역 변수의 임의 함수에 대해 작동 하며, 역으로 위장하는 대신 연산 를 명시 적으로 보여줍니다 (예 : "convolution"공식은 덧셈으로 덧셈을 가장합니다) ).⊙
추신. 방금 주사위를 굴 렸습니다. 그것이 나오는 것을 및 Y = 6 것을 의미, Q = 6 , R = 15 , S = 2.25 , T = 11 , U가 = 30 및 V = 15,625 . 이제 알 잖아 ;-)X=5Y=6Q=6R=15S=2.25T=11U=30V=15625