식 (2.11)은 다음과 같은 작은 평등의 결과입니다. 임의의 두 변수 및 및 모든 함수Z 2 gZ1Z2g
EZ1,Z2(g(Z1,Z2))=EZ2(EZ1∣Z2(g(Z1,Z2)∣Z2))
표기법 은 공동 분포에 대한 기대치 입니다. 표기법 은 본질적으로 " 가 고정 된 것처럼 의 조건부 분포에 대해 적분 "이라고 표시합니다. E Z 1 ∣ Z 2 Z 1 Z 2EZ1,Z2EZ1∣Z2Z1Z2
과 가 관련 정의를 풀기 만하면 불연속 랜덤 변수 인 경우이를 쉽게 확인할 수 있습니다.Z 2Z1Z2
EZ2(EZ1∣Z2(g(Z1,Z2)∣Z2))=EZ2(∑z1g(z1,Z2)Pr(Z1=z1∣Z2))=∑z2(∑z1g(z1,z2)Pr(Z1=z1∣Z2=z2))Pr(Z2=z2)=∑z1,z2g(z1,z2)Pr(Z1=z1∣Z2=z2)Pr(Z2=z2)=∑z1,z2g(z1,z2)Pr(Z1=z1,Z2=z2)=EZ1,Z2(g(Z1,Z2))
연속적인 사건은이 논증의 한계로 비공식적으로 보거나, 모든 측정 이론적 도파가 정해지면 공식적으로 검증 될 수있다.
응용 프로그램을 해제하려면 , 및 취하십시오 . 모든 것이 정확하게 정렬됩니다.Z 2 = X g ( x , y ) = ( y − f ( x ) ) 2Z1=YZ2=Xg(x,y)=(y−f(x))2
주장 (2.12)은 최소화를 고려하도록 요구한다
EXEY∣X(Y−f(X))2
여기서 원하는대로 를 자유롭게 선택할 수 있습니다 . 다시 개별 케이스에 초점을 맞추고 위의 풀림에 반쯤 떨어지면 우리는 최소화하고 있음을 알 수 있습니다f
∑x(∑y(y−f(x))2Pr(Y=y∣X=x))Pr(X=x)
큰 괄호 안에있는 모든 것은 음이 아니며, 소환자를 개별적으로 최소화하여 음이 아닌 양의 합계를 최소화 할 수 있습니다. 문맥 상 이것은 최소화하기 위해 를 선택할 수 있다는 것을 의미합니다f
∑y(y−f(x))2Pr(Y=y∣X=x)
각 이산 값 에 대해 개별적으로 . 이것은 ESL이 주장하는 내용의 내용이며, 더 멋진 표기법으로 만 제공됩니다.x