누구나“임의 변수의 합”이라는 개념을 명확히 할 수 있습니까?


21

내 확률 클래스에서는 "임의 변수의 합"이라는 용어가 지속적으로 사용됩니다. 그러나 나는 그것이 정확히 무엇을 의미하는지 고집하고 있습니까?

우리는 임의의 변수로부터 많은 실현의 합에 대해 이야기하고 있습니까? 그렇다면 하나의 숫자를 합산하지 않습니까? 임의의 변수 실현의 합은 어떻게 우리에게 어떤 종류의 분포 또는 cdf / pdf / 함수를 가져 옵니까? 그리고 무작위 변수 실현이 아니라면 정확히 무엇이 추가됩니까?


1
'임의 변수의 실현'이란 실제 관측 값을 의미한다고 가정합니다. '임의 변수의 합'에서 합산되는 것은 관찰되기 전의 임의 변수입니다. 엘리베이터를 타고 다음 5 명의 체중을 계산한다고 상상해보십시오. 당신은 그들의 무게 (아직)를 모릅니다. 그래서 그들은 각각 무작위 변수입니다. 그러나 당신은 아마도 그들의 무게의 합의 분포에 대해 알고 싶을 것입니다.
PeterR

@PeterR 이것은 내가 이해하지 못하는 것입니다. 아직 가치가없는 것을 추가하는 것에 대해 이야기하는 것이 합리적입니까? 은유 적 유형의 합산입니까?
Gosset

1
문제는 임의 변수가 무엇인지 이해하지 못한다는 것입니다. 이 개념을 얻는다면 합도 쉽게 올 것입니다.
Aksakal

@ Aksakal 내가 이미이 질문에 대한 증거를 게시 한 사실이 아닙니까? 아마 당신이 그것을 알고 있다면, 당신은 개념을 명확히 할 수 있습니까?
Gosset

큰 답변이 주어졌습니다. 또 다른 좋은 예는 두 개의 주사위, 의 합입니다 . 결과는 분명히 무작위입니다 (두 주사위의 합이 무엇인지 미리 알 수 없습니다). 우리는 과 독립적 이라는 것을 알고 있습니다. 그것은 밝혀 삼각 분포를 갖는다. X+YX,YUnif(1,6)X+Y
bdeonovic

답변:


39

임의 변수의 물리적이고 직관적 인 모델은 하나 이상의 종이 표지 ( "티켓")에 모집단의 모든 구성원의 이름을 기록하고 해당 티켓을 상자에 넣는 것입니다. 상자 내용물을 철저히 혼합 한 다음 복권에서와 같이 정확히 하나의 티켓을 맹목적으로 뽑아내는 과정으로 모형의 무작위성이 결정됩니다. 비 균일 확률은 상자에 가변 수의 티켓을 도입하여 모델링됩니다. 가능성이 높은 회원에 대한 티켓 수가 많을수록 확률이 낮을수록 적습니다.

랜덤 변수 모집단의 각 멤버와 관련된 숫자이다. (따라서 일관성을 위해, 주어진 멤버에 대한 모든 티켓에는 동일한 숫자가 쓰여 져야합니다.) 여러 개의 임의의 변수는 하나 이상의 숫자에 대한 티켓의 공간을 예약하여 모델링됩니다. 일반적으로 및 와 같은 공백 이름을 제공합니다 . 이러한 임의 변수 의 은 일반적인 합입니다. 합에 대해 모든 티켓에 새 공간을 예약하고, 각 티켓에 대한 의 값을 읽고 새 공간에 합계를 씁니다. 이것은 티켓에 숫자를 쓰는 일관된 방법이므로 다른 임의의 변수입니다.X, Y,ZX, Y,

그림

이 그림은 모집단 및 3 개의 임의 변수 X , YX + Y를 나타내는 상자를 나타냅니다 . 에 대한 세 가지 :이 여섯 티켓 포함 α 그것의 확률 줄 (블루) 3 / (6) 의 두 β 그것의 확률 줄 (노란색) 2 / 6 , 및 대한 하나의 γ (녹색) 그것의 가능성을 제공 1 / 6Ω={α,β,γ}XYX+Yα3/6β2/6γ1/6. 티켓에 쓰여진 내용을 표시하기 위해 티켓이 혼합되기 전에 표시됩니다.

이 접근법 의 장점은 질문의 모든 역설적 부분이 정확하다는 것입니다.

  • 랜덤 변수의 합은 실제로 하나의 명확한 숫자 (인구의 각 구성원에 대해)입니다.

  • 그러나 그것은 또한 분포 (박스에 합계가 나타나는 빈도에 의해 주어진)로 이어지고,

  • 티켓이 여전히 맹목적으로 그려지기 때문에 여전히 임의의 프로세스를 효과적으로 모델링합니다 .

이러한 방식으로 합계는 확정 된 값을 가질 수 있으며 (각 티켓의 숫자에 적용되는 덧셈 규칙에 의해 제공됨) 실현 ( 상자에서 그린 티켓이 될 것임)은 수행됩니다.

상자에서 티켓을 뽑는이 물리적 모델은 이론적 문헌에서 채택되었으며 샘플 공간 (모집단), 시그마 대수 (관련 확률 측정 값 포함) 및 랜덤 변수를 샘플 공간에 정의 된 측정 가능한 함수로 엄격하게 정의했습니다. .

이 랜덤 변수에 대한 설명은 실제 예를 들어 "임의 변수 란 무엇입니까?"에 자세히 설명 되어 있습니다. .


3
예시 게시물 +1 나는 당신이 무의미한 질문을 신경 쓰지 않기를 바랍니다. 그러나 그 비유는 무엇을 했습니까?
Glen_b-복지 모니카

4
@Glen_b PowerPoint :-). 상자 이미지는 mymiddlec.files.wordpress.com/2013/09/empty-box.jpg 의 이미지입니다 . 티켓은 파워 포인트 그래픽입니다. (이러한 질문에 대해서는 아무런 의미가 없습니다!) 나는 전체 무리를 그룹화하여 Paint에 붙여 넣은 다음 그것을 .png 파일로 저장하는 데 사용했습니다.
whuber

나는 뭔가를 놓치고 있지만 인구의 각 구성원에 여러 숫자 레이블을 쓰는 것 같습니다. 모든 알파 가진 X = 1, Y = 2, 따라서 X + Y = 3 ... X, Y 및 X + Y는 정확히 동일한 분포를 갖기 때문에, 다른 lebels의 여기 값이 값만큼 시프트
MiloMinderbinder

1
@whuber-기록 빈도가 있어야합니다. 수학 용어에 정통하지 않아 '기본 확률 측정법'이라고 말할 수는 없습니다. 어쨌든 당신은 내 드리프트를 받고 있습니다. 티켓에 숫자를 사용하여 원하는 확률 분포를 얻는 방법을 알아보기 시작했습니다. 커서 수준 에서이 접근법은 다른 '라벨'을 가진 단어처럼 보였으므로 명확하게 보지 못했습니다. 이 사이트에서 나를 도와 준 50 번째 시간과 같습니다. 감사합니다
MiloMinderbinder

1
@Milo 천만에요. 앞의 주석에서 제시 한 예가 아니라이 답변의 예에 반응하고 있음을 알 수 있습니다. 대답의 예에는 실제로 상대 빈도가 1 : 2 : 3 인 세 개의 다른 티켓이 있으며,이 경우 "확률 측정"이 의미하는 것입니다. 이 아닌 단지 기본 개념에 대한 깊은 필요가있다 :하지만, 전문 용어. 특히 멋진 계정에 대해서는 stats.stackexchange.com/questions/199280 을 참조하십시오 .
whuber

4

이 문구 뒤에 숨겨진 비밀은 없습니다. 생각할 수있는 것처럼 간단합니다. X와 Y가 두 개의 임의 변수 인 경우 그 합은 X + Y이며이 합도 임의 변수입니다. X_1, X_2, X_3, ..., X_n이고 n 개의 랜덤 변수 인 경우 합은 X_1 + X_2 + X_3 + ... + X_n이며이 합은 또한 임의 변수입니다 (그리고이 합의 실현은 단일입니다 숫자, 즉 n 실현의 합).

왜 클래스의 랜덤 변수의 합에 대해 그렇게 많이 이야기합니까? 하나의 이유는 (놀라운) 중심 한계 정리입니다. 만약 우리가 많은 독립적 인 랜덤 변수를 합하면, 합계에서 단일 변수의 분포와 무관하게이 합계의 분포를 (거의) 예측할 수있는 것보다! 합은 정규 분포가되는 경향이 있으며 이것이 실제 세계에서 정규 분포를 자주 관찰하는 이유입니다.


3

rv는 이벤트 발생과 실수 사이의 관계입니다. 비가 오면 X 값이 1이고 0이 아니면 0입니다. 추울 때는 10, 뜨거울 때는 100과 같은 rv Y를 가질 수 있습니다. 비가 오면 추우면 X = 1, Y = 10, X + Y = 11입니다.

X + Y 값은 10 (비가 내리지 않음)입니다. 11 (비, 냉기), 100 (비, 뜨지 않음) 및 110 (비, 뜨기). 이벤트의 확률을 파악하면이 새로운 rv X + Y의 PMF를 얻게됩니다.


1

X,YX+YΩ1×Ω2X,YΩ={Head,Tail}X(Head)=Y(Head)=1,X(Tail)=Y(Tail)=0(X+Y)X,YσX,Y

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.