제 생각에 원하는 도구를 전환 회귀라고합니다. 아이디어는 여러 회귀선이 있으며 각 데이터 요소가 그중 하나에 할당된다는 것입니다. 예를 들어, 첫 번째 회귀선의 방정식은 다음과 같습니다.
회귀선
의 방정식은 다음과 같습니다.
전체적으로 개의 다른 회귀선이 있습니다. 주어진 데이터 포인트에 대해 회귀선 중 하나만 볼 수 있습니다. 따라서 각 점에 대해 어떤 회귀선을 볼지 결정하는 메커니즘이 있어야합니다. 가장 간단한 메커니즘은 다항식 분포입니다. 즉, 우리는
Yi=α1+β1Xi+ϵi
mthYi=αm+βmXi+ϵi
Mmth확률이 인 회귀선 , 여기서 입니다.
pm∑mpm=1
모형은 일반적으로 최대 가능성으로 추정됩니다. 이 분포되어 있다고 가정하면 최대화 할 가능성 함수는 다음과 같습니다.
함수 는 표준 정규 밀도입니다. 제약 조건 에 따라 매개 변수 에서이를 최대화합니다 . 이 문제를 해결하기 위해 준 뉴턴 방법을 사용하려는 경우 일반적으로 다소 까다로운 최대화 문제입니다. 모든 및 를 0에서 시작할 수는 없습니다 .ϵN(0,σ2)
L(α,β,σ)=∑m=1Mpm1σϕ(Yi−α1−β1Xiσ)
ϕ3M+1∑mpm=1,pm≥0αβpm 에서 예. 알고리즘이 "그들을 구별"할 수 있도록 및 고유 한 시작 값을 제공해야합니다 .
1Mαβ
원하는 경우이 작업을보다 관련시키는 방법에는 여러 가지가 있습니다. 영향을 미치는 생각되는 변수 가있을 수 있습니다 . 이는 어떤 회귀가 선택되는지에 영향을줍니다. 음, 확인 다항식로 함수를 사용 의 함수 :
ZipmpmZi
L(α,β,σ)=∑m=1M(exp(δm+γmZi)∑m′exp(δm′+γm′Zi))1σϕ(Yi−α1−β1Xiσ)
이제 매개 변수가 있습니다. 실제로, 설명 을 위해 --- 에 대한 정규화가 필요하기 때문에 매개 변수가 있습니다.5 M - 1 δ , γ5M+15M−1δ,γ
더 복잡하게 만드는 또 다른 방법 은 회귀선 수인 을 선택하는 방법을 사용하는 것입니다 . 나는 내 일에서 이런 종류의 선택에 대해 매우 우연한 일이므로 다른 누군가가 당신을 선택하는 가장 좋은 방법으로 당신을 가리킬 수 있습니다.M