우리가 책을 읽을 때, 표기법을 이해하는 것은 내용을 이해하는 데 매우 중요한 역할을합니다. 불행히도, 다른 커뮤니티는 모델의 공식화와 최적화 문제에 대해 다른 표기법을 가지고 있습니다. 여기에 몇 가지 공식 표기법을 요약하고 가능한 이유를 제시 할 수 있습니까?
선형 대수 문학에서 고전 서적은 Strang의 선형 대수학 소개 입니다. 이 책에서 가장 많이 사용되는 표기법은
여기서 A는 , 계수 매트릭스는 , 은 IS 해결해야 할 변수 및 의 벡터이고, 식의 우측 . 이 책이이 표기법을 선택 하는 이유 는 선형 대수학의 주요 목표는 선형 시스템을 풀고 벡터 가 무엇인지 알아내는 것입니다 . 이러한 공식이 주어지면 OLS 최적화 문제는x b x
통계 또는 기계 학습 문맹 (책 통계 학습의 요소에서 )에서 사람들은 다른 표기법을 사용하여 동일한 것을 나타냅니다.
여기서 은 IS 데이터 매트릭스 , 는 IS 계수들 또는 가중치 학습을 배울 수 , 응답이다. 사람들이 이것을 사용 하는 이유 는 통계 또는 기계 학습 커뮤니티의 사람들이 데이터 중심 이기 때문에 데이터 와 응답 이 와 를 사용 하여 나타내는 가장 흥미로운 것 입니다.
이제 가능한 모든 혼란이있을 수 있습니다. 첫 번째 방정식의 A 는 두 번째 방정식의 X 와 같습니다. 그리고 두 번째 방정식에서 X 를 풀 필요가 없습니다. 또한 용어 : A 는 선형 대수의 계수 행렬이지만 통계의 데이터입니다. \ beta 는 "계수"라고도합니다.
또한 는 사람들이 기계 학습에 널리 사용되는 것과 정확히 일치하지 않으며 사람들은 모든 데이터 포인트를 요약 하는 반 벡터화 버전을 사용합니다 . 와 같은
그 이유는 확률 적 경사 하강 및 기타 다른 손실 함수에 대해 이야기 할 때 좋기 때문이라고 생각합니다. 또한 간결한 행렬 표기법은 선형 회귀 이외의 다른 문제에서 사라집니다.
누구든지 다른 문헌을 넘는 표기법에 대해 더 많은 요약을 줄 수 있습니까? 이 질문에 대한 현명한 답변이 다른 문헌을 넘는 책을 읽는 사람들에게 좋은 참고 자료로 사용될 수 있기를 바랍니다.
내 예제 및 로 제한하지 마십시오 . 다른 많은 것들이 있습니다. 와 같은X β = y