나는 의 본질이 궁금하다 . " 은 데이터에 대해 무엇을 말합니까?"에 대해 직관적으로 말할 수있는 사람이 있습니까?
편집하다:
답장을 보내 주셔서 감사합니다
훌륭한 코스를 수강 한 후 몇 가지 요점을 추가하고 싶습니다.
- 정보의 측정 값, 즉 는 방향 x를 따른 정보량입니다 .
- 이중성은 : 부터 명확한 긍정적 인, 그래서이다 Σ - 1 그들은 내적 규범이되어 우리가 본격화 최소 제곱 문제에 대한 Fenchel 듀얼를 도출 할 수 있도록보다 정밀하게 서로의 이중 규범이 있으며, 이중 WRT 극대화 할 수 있도록, 문제. 컨디셔닝에 따라 둘 중 하나를 선택할 수 있습니다.
- 힐버트 공간 : 과 의 열과 행 은 같은 공간에 걸쳐 있습니다. 따라서 또는 Σ로 표현하는 것 사이에는 이점이 없습니다 (이러한 행렬 중 하나가 잘못 조절 된 경우)
- 빈번한 통계 : Cramér-Rao 경계를 사용하여 Fisher 정보와 밀접한 관련이 있습니다. 실제로, 피셔 정보 매트릭스 (자체와 함께 로그 우도의 구배의 외부 산물)는 Cramér-Rao에 바인딩되어 있습니다. 즉, (양수 반 구체 원뿔, iewrt 농도 타원체). 따라서 때 최대 가능성 추정기가 효율적입니다. 즉, 최대 정보가 데이터에 존재하므로 잦은 정권이 최적입니다. 간단히 말하면, 일부 우도 함수의 경우 (유도의 기능적 형태는 순전히 데이터를 생성 한 확률 적 모델, 즉 생성 모델에 의존 함), 최대 우도는 효율적이고 일관된 추정기, 보스와 같은 규칙입니다. (과도하게 사용하여 죄송합니다)
3
PCA가 작은 고유 값보다 큰 고유 값을 가진 고유 벡터를 선택한다고 생각합니다.
—
wdg
그것의 열의 주장 동등하기 때문에 (3)이 올바르지 않습니다 의 것이며 만 행렬 마찬가지이다 (최대 순열).
—
whuber