어쩌면 피곤한 것일 수도 있지만 Forward Stagewise Regression 알고리즘을 이해하는 데 어려움을 겪고 있습니다. 에서 "통계 학습의 요소" 60 페이지 :
전단계 회귀 (FS)는 전단계 회귀보다 훨씬 더 제한적입니다. 그것은 [y]의 평균과 동일한 절편을 갖는 순차 단계적 회귀처럼 시작하며, 계수가 처음 인 중심 예측 변수는 모두 0입니다.
각 단계에서 알고리즘은 현재 잔차와 가장 관련이있는 변수를 식별합니다. 그런 다음이 선택된 변수의 잔차에 대한 단순 선형 회귀 계수를 계산 한 다음 해당 변수의 현재 계수에 추가합니다. 변수가 잔차와 상관 관계가 없어 질 때까지 계속됩니다. 즉 N> p 인 경우 최소 제곱합입니다.
그래서 이것이 알고리즘입니까? :
b[1]=mean(y)
b[2..n]=0
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
while(abs(maxCorr) > someThreshold)
b[index]=b[index]+regress(r,X[1..n][index])
r=(y-X*b)
index, maxCorr = max(transpose(r)*X)
b는 계수의 열-벡터이고, X는 입력 행렬이며, y는 출력의 열-벡터입니다. 즉 y = X * b + 오류입니다.
이 알고리즘은 테스트 할 데이터 세트에 대해 0이 아닌 몇 가지 계수 만 제공하므로 임계 값 = .0001로 예측 정확도가 전혀 좋지 않습니다.