나는 FDA에서 Jim Ramsay와 몇 년 동안 일 했으므로 @amoeba의 답변에 몇 가지 설명을 추가 할 수 있습니다. @amoeba는 기본적으로 옳습니다. 적어도 이것이 FDA를 공부 한 후에 마침내 도달 한 결론입니다. 그러나 FDA 프레임 워크는 왜 고유 벡터를 평활화하는 것이 단순한 문제가 아닌지에 대한 흥미로운 이론적 통찰력을 제공합니다. 평활도 패널티가 포함 된 내부 제품에 따라 기능 공간에서의 최적화는 기본 스플라인의 유한 치수 솔루션을 제공합니다. FDA는 무한 차원 함수 공간을 사용하지만 분석에는 무한한 차원이 필요하지 않습니다. 그것은 가우시안 프로세스 나 SVM의 커널 트릭과 같습니다. 실제로 커널 트릭과 매우 비슷합니다.
Ramsay의 원래 작업은 데이터의 주요 스토리가 분명한 상황을 처리했습니다. 기능이 다소 선형 적이거나 다소 주기적입니다. 표준 PCA의 주요 고유 벡터는 기본적으로 우리가 이미 알고있는 것을 알려주는 함수의 전체 수준과 선형 추세 (또는 사인 함수)를 반영합니다. 흥미로운 특징은 잔차에 있으며, 이제 목록 상단에서 몇 개의 고유 벡터가 있습니다. 그리고 각각의 후속 고유 벡터는 이전의 고유 벡터와 직교해야하므로, 이러한 구조는 분석의 아티팩트에 의존하고 데이터의 관련 특징에 덜 의존합니다. 요인 분석에서 경사 요인 회전은이 문제를 해결하는 것을 목표로합니다. 램지의 아이디어는 구성 요소를 회전시키지 않는 것이 었습니다. 오히려 분석의 요구를 더 잘 반영 할 수있는 방식으로 직교성의 정의를 바꾸는 것. 이는 주기적 구성 요소에 관심이 있다면디삼− D디2
OLS로 추세를 제거하고 해당 작업의 잔차를 조사하는 것이 더 간단하다고 반대 할 수도 있습니다. FDA의 부가가치가이 방법의 엄청난 복잡성에 가치가 있다고 확신하지 못했습니다. 그러나 이론적 인 관점에서, 관련된 문제를 고려해 볼 가치가 있습니다. 데이터에 대한 우리의 모든 일은 일을 망칩니다. OLS의 잔차는 원본 데이터가 독립적 인 경우에도 상관됩니다. 시계열을 평활화하면 원시 계열에 없었던 자기 상관이 발생합니다. FDA의 아이디어는 초기 디트 렌딩에서 얻은 잔차가 관심 분석에 적합하도록하는 것입니다.
FDA는 스플라인 기능이 활발히 연구되고있는 80 년대 초반에 유래했음을 기억해야합니다. Grace Wahba와 그녀의 팀을 생각해보십시오. 그 이후로 SEM, 성장 곡선 분석, 가우스 프로세스, 확률 적 프로세스 이론의 추가 개발 등과 같은 다변량 데이터에 대한 많은 접근 방식이 등장했습니다. FDA가 해결해야 할 질문에 대한 최선의 접근 방식으로 남아 있는지 확실하지 않습니다. 다른 한편으로, FDA의 취지에 대한 응용을 볼 때 저자가 FDA가 무엇을하려고하는지 실제로 이해하는지 궁금합니다.