“기능과 클래스 간 매개 변수 공유”는 무엇을 의미합니까?


답변:


22

가장 간단한 선형 분류기 중 하나 인 로지스틱 회귀 분석을 통해이 질문에 대답하려고합니다 .

로지스틱 회귀 분석의 가장 간단한 경우는 이진 분류 작업 ( 입력 기능 ( x R )이 하나 뿐인 경우 입니다. 이 경우 로지스틱 회귀의 결과는 다음과 같습니다.y{0,1})xR

여기서,wB모두스칼라. 모델의 출력 Y는[0,1]확률에 대응하고 그X는클래스이어야한다1.

y^=σ(wx+b)
wby^[0,1]x1

"선형 분류기는 피쳐와 클래스간에 매개 변수를 공유하지 않습니다" 라는 문구 를 두 부분으로 분류 하려고합니다 . 로지스틱 회귀가 해당 작업에 대한 매개 변수를 공유하는지 확인하기 위해 여러 기능과 여러 클래스의 사례를 개별적으로 조사합니다.

선형 분류기는 기능간에 매개 변수를 공유합니까?

이 경우 각 예에서 는 (이전과 같이) 이진 값을 취하는 스칼라이고 x 는 길이 N벡터 입니다 (여기서 N 은 피처 수). 여기서 출력은 입력 기능의 선형 조합입니다 (즉, 이러한 기능의 가중치 합계와 바이어스).yxNN

여기서 x w 는 길이 N의 벡터입니다. 곱 xw 는 스칼라를 생성합니다. 이 A는 위에서를 알 수있는 바와 같이별도의 중량 (W) 각 입력에 대한 기능은 X I를 이러한 가중치는독립적꼭. 이것으로부터 우리는기능들간에 매개 변수 공유없다고결론 내릴 수있습니다.

y^=σ(iN(wixi)+b)orσ(wx+b)
xwNxw wixi

선형 분류기는 클래스간에 매개 변수를 공유합니까?

이 경우 는 스칼라이지만 y 는 길이 M벡터 입니다 (여기서 M 은 클래스 수). 이를 해결하기 위해 로지스틱 회귀는 기본적으로 각 M 클래스 에 대해 별도의 출력 y j 를 생성합니다 . 각 출력은 스칼라 y j[ 0 , 1 ] 이며 x 가 클래스 j에 속할 확률에 해당합니다 .xyMMyjMyj[0,1]xj

y^=wx+b,wherey^=y^1,y^2,...,yM

M

y^j=σ(wjx+bj)

From the above it is obvious that no weights are shared among the different classes.

multi-feature and multi-class:

By combining the two cases above we can finally reach the most general case of multiple features and multiple classes:

y^=σ(Wx+b)
where y^ is a vector with a size of M, x is a vector with a size of N, b is a vector with a size of M and W is a matrix with a size of (N×M).

In any case, linear classifiers do not share any parameters among features or classes.

To answer your second question, linear classifiers do have an underlying assumption that features need to be independent, however this is not what the author of the paper intended to say.


1
Nice explanation. :)
joydeep bhattacharjee
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.