몇 년 전에 이것을 처음부터 처음부터 프로그래밍했으며 컴퓨터에서 부분 선형 회귀를 수행하기위한 Matlab 파일이 있습니다. 약 1 ~ 4 개의 브레이크 포인트가 약 20 개의 측정 포인트에 대해 계산 가능합니다. 5 개 또는 7 개의 중단 점이 실제로 너무 많아지기 시작합니다.
내가 보는 순수한 수학적 접근 방식은 사용자 mbq가 제안한대로 가능한 모든 조합을 시도하여 질문 아래의 주석에 링크 된 것입니다.
적합 선은 모두 연속적이고 인접하며 (겹치지 않음) 결합기는 파스칼 삼각형을 따릅니다. 선 세그먼트에 의해 사용 된 데이터 포인트간에 겹치는 부분이 있다면 조합이 두 번째 종류의 스털링 번호를 따르는 것으로 생각합니다.
내 마음에 가장 좋은 해결책은 적합 선의 R ^ 2 상관 값의 표준 편차가 가장 낮은 적합 선의 조합을 선택하는 것입니다. 예를 들어 설명하려고합니다. 데이터에서 몇 개의 브레이크 포인트를 찾아야하는지 묻는 것은 "영국 해안은 얼마나 오래 걸립니까?"라는 질문과 비슷합니다. 프랙탈에 대한 Benoit Mandelbrots (수학자) 논문 중 하나에서와 같이. 그리고 중단 점 수와 회귀 깊이 사이에는 절충점이 있습니다.
이제 예입니다.
와이엑스엑스와이
엑스12삼45678910111213141516171819202122232425262728와이12삼45678910987654삼212삼45678910아르 자형2L I N 예 11 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0000 , 97090 , 89510 , 77340 , 61340 , 43210 , 25580 , 11390 , 027200 , 00940 , 02220 , 02780 , 02390 , 01360 , 00320 , 00040 , 01180 , 04아르 자형2l i n e 20 , 04000 , 01180 , 00040 , 00310 , 01350 , 02380 , 02770 , 02220 , 0093− 1 , 9780 , 02710 , 11390 , 25580 , 43210 , 61340 , 77330 , 89510 , 97081 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 000s u m o f아르 자형2v a l u e s1 , 04001 , 01181 , 00041 , 00311 , 01351 , 02381 , 02771 , 02221 , 00931 , 0000 , 99801 , 00901 , 02921 , 04551 , 04551 , 02911 , 00900 , 99801 , 0001 , 00941 , 02221 , 02781 , 02391 , 01361 , 00321 , 00041 , 01181 , 04s t a n da r d디e v i a t i o n o f아르 자형20 , 67880 , 69870 , 70670 , 70480 , 69740 , 69020 , 68740 , 69130 , 70040 , 70710 , 66730 , 55230 , 36590 , 12810 , 12820 , 36590, 55230 , 66720, 70710, 70040 , 69140, 68740, 69020, 69740, 70480 , 70680, 69870 , 6788
이 y 값에는 그래프가 있습니다.
분명히 두 개의 중단 점이 있습니다. 인수를 위해 R ^ 2 상관 관계 값을 계산합니다 (Excel 셀 수식 사용 (유럽 도트 쉼표 스타일)).
=INDEX(LINEST(B1:$B$1;A1:$A$1;TRUE;TRUE);3;1)
=INDEX(LINEST(B1:$B$28;A1:$A$28;TRUE;TRUE);3;1)
두 개의 적합 선이 겹치지 않는 모든 조합에 적용됩니다. 가능한 모든 R ^ 2 값 쌍에는 그래프가 있습니다.
문제는 어떤 R ^ 2 값 쌍을 선택해야하는지, 제목에서 요구 한대로 여러 중단 점으로 일반화하는 방법은 무엇입니까? 하나의 선택은 R- 제곱 상관의 합이 가장 높은 조합을 선택하는 것입니다. 이것을 플롯하면 아래의 파란색 상단 곡선이 나타납니다.
1 , 0455
조각 현명한 선형 회귀-Matlab-다중 중단 점