가 다음과 같은 로지스틱 회귀 분석에서 목적 함수 의 Hessian을 도출하는 데 어려움이 있습니다 . :
는 로지스틱 함수입니다. 헤 시안은 입니다. I가 계산하여 도출하려고 하지만 다음은 행렬 표기법으로 얻는 방법을 그다지 명백하지 않았다 . ∂2l(θ)
아무도 를 도출하는 깨끗하고 쉬운 방법을 알고 있습니까?
가 다음과 같은 로지스틱 회귀 분석에서 목적 함수 의 Hessian을 도출하는 데 어려움이 있습니다 . :
는 로지스틱 함수입니다. 헤 시안은 입니다. I가 계산하여 도출하려고 하지만 다음은 행렬 표기법으로 얻는 방법을 그다지 명백하지 않았다 . ∂2l(θ)
아무도 를 도출하는 깨끗하고 쉬운 방법을 알고 있습니까?
답변:
여기서는 솔루션이 자체적으로 포함되는 데 필요한 모든 속성과 ID를 도출하지만이 파생물은 깨끗하고 쉽습니다. 표기법을 공식화하고 손실 함수를 좀 더 간결하게 작성하겠습니다. 고려 샘플 되도록 및 . 이항 로지스틱 회귀 분석에서는 일반적으로 가설 함수 가 로지스틱 함수라는 것을 상기하십시오. 공식적으로
여기서 및 입니다. 손실 기능 (OP에 음수 부호가 없다고 생각)은 다음과 같이 정의됩니다.
나중에 참조하기 위해 여기서 유도하는 로지스틱 함수의 두 가지 중요한 특성이 있습니다. 먼저 입니다.
또한
성분에 대한 도함수를 취하는 대신 여기에서 벡터를 직접 사용합니다 ( 여기서는 벡터가있는 도함수를 검토 할 수 있음 ). 손실 함수 의 Hessian은 의해 주어 지지만 먼저 및 .
하자 . 위에서 파생 한 속성과 체인 규칙 사용
이제는 그것을 보여주는 것은 사소한 일입니다.
아휴!
마지막 단계는 Hessian을 계산하는 것입니다
들어 샘플 우리가 . 이것은 벡터 열을 연접 동등 행렬로 크기의 되도록 . 스칼라 항은 되도록 대각 행렬 로 결합됩니다 . 마지막으로, 우리는 결론
모든 샘플을 처음부터 한 번에 고려하고 대신 매트릭스 파생물을 사용하여 더 빠른 접근 방식을 도출 할 수 있습니다. 참고로,이 공식을 사용하면 가 볼록한 것을 보여주는 것은 사소한 일 입니다. 하자 임의 벡터 일되도록 . 그때
및 이기 때문 입니다. 이것은 가 양의 반 음성이므로 이 볼록 하다는 것을 의미합니다 (단, 볼록하지는 않습니다).