나는 당신이 직관적 인 설명을 요구하고 공식적인 정의를 생략하도록 요구했지만, 그것들은 다소 관련이 있다고 생각하므로 전형적인 세트의 정의를 상기시켜 드리겠습니다.
X1,X2,...아르IID랜덤 변수∼ p(x) 다음 전형적인 세트 ( N ) ε 에 대하여 P ( X는 ) 시퀀스의 집합이다 ( X 1 , X 2 , . . . , X N ) ∈ χ N 특성과
2 - n ( H (A(n)ϵp(x)(x1,x2,...,xn)∈χn2−n(H(X)+ϵ)≤p(x1,x2,...,xn)≤2−n(H(X)−ϵ)(1)
고정을위한 것으로 이러한 수단ϵ전형적인 세트는 모든 서열로 구성되는 그 확률은가까이에2−nH(X). 따라서 시퀀스가 일반적인 집합에 속하기 위해서는 확률이2−nH(X) 이지만 일반적으로 그렇지 않습니다. 이유를 이해하려면log2 를적용하여 방정식 1을 다시 작성하겠습니다.
H(X)−ϵ≤1nlog2(1p(x1,x2,...,xn))≤H(X)+ϵ(2)
이제 전형적인 집합 정의는 엔트로피의 개념과 더 직접적으로 관련되거나 랜덤 변수의 평균 정보라는 다른 방법으로 언급됩니다. 중간 항은 시퀀스의 샘플 엔트로피로 생각할 수 있으므로 일반적인 세트는 랜덤 변수 X 의 평균 정보에 가까운 양의 정보를 제공하는 모든 시퀀스에 의해 이루어집니다 . 가장 가능성이 높은 순서는 일반적으로 평균보다 적은 정보를 제공합니다. 결과의 확률이 낮을수록 우리에게 제공하는 정보가 많아 질 것입니다. 왜 내가 예를 들어 주 었는지 이해하려면 :
24 ° C와 26 ° C 사이의 날씨가 맑고 따뜻할 가능성이 높은 도시에 살고 있다고 가정 해 봅시다. 매일 아침 날씨 보고서를 볼 수 있지만 그다지 신경 쓰지 않을 것입니다. 항상 맑고 따뜻합니다. 그러나 언젠가 날씨 남자 / 여자가 오늘 비가 내리고 추울 것이라고 말하면 그것은 게임 체인저입니다. 당신은 다른 옷을 입어야하고 우산을 가지고 평소에하지 않는 다른 일을해야하므로 날씨가 좋은 정보를주었습니다.
요약하면, 전형적인 세트의 직관적 정의는 소스 (임의 변수)의 예상되는 정보에 가까운 양의 정보를 제공하는 시퀀스로 구성된다는 것입니다.
$$H(X)-\epsilon\le \frac{1}{n}log_2(\frac{1}{p(x_1,x_2,...,x_n)}) \le H(X)+\epsilon \tag{2}$$
...