기능적 데이터 분석과 고차원 데이터 분석의 차이점


10

통계 문헌에는 " 기능적 데이터 "(즉, 곡선 인 데이터) 및 " 고차원 데이터 "(즉, 데이터가 고차원 벡터 인 경우)에 대한 많은 참조가있다. 내 질문은 두 가지 유형의 데이터의 차이점에 관한 것입니다.

사례 1에 적용되는 통계적 방법론에 대해 이야기 할 때 사례 2의 함수론을 유한 공간 부분 공간으로의 투영을 통한 방법론의 표현으로 이해할 수 있습니다. 그리고 함수 문제를 유한 차원 벡터 문제로 해석 할 것입니다 (적용된 수학에서는 모든 것이 유한하기 때문에).

내 질문은 : 기능 데이터에 적용되는 통계 절차를 고차원 데이터에도 (거의 직접) 적용 할 수 있고 고차원 데이터 전용 절차는 기능 데이터에 (거의 직접) 적용 할 수 있다고 말할 수 있습니까?

대답이 '아니요'인 경우 설명 할 수 있습니까?

Simon Byrne의 답변을 사용하여 편집 / 업데이트 :

  • 희소성 (S- 스파 스 가정, 공 및 대한 약한 공 )은 고차원 통계 분석에서 구조적 가정으로 사용됩니다.lplpp<1
  • "부드러움"은 기능적 데이터 분석에서 구조적 가정으로 사용됩니다.

한편, 역 푸리에 변환 및 역 웨이블릿 변환은 희소성을 평활도로 변환하고, 평활도는 웨이블릿 및 푸리에 변환에 의해 희소로 변환된다. 이것은 Simon이 언급 한 비판적 차이를 그렇게 비판적으로 만들지 않습니까?


1
스무딩 기능적 데이터 분석의 큰 부분이며, 적절한 기준 (예 : 푸리에 또는 웨이블릿)으로 투영하여 벡터 평균 추정 문제로 변환 될 수 있지만, 기능적 데이터 분석에는 그렇지 않은 기능적 구조에 따라 다른 문제가 있습니다 쉽게 번역하지 않습니다. 공변량의 함수 반응 예측에 관심이있는 함수 회귀 분석을 예로 들어 보겠습니다.
vqv

답변:


12

기능적 데이터는 종종 다른 질문을 포함합니다. 저는 Functional Data Analysis, Ramsey 및 Silverman을 읽고 있으며 곡선 등록, 함수 뒤틀림 및 곡선 미분 추정에 대해 많은 시간을 보냅니다. 이는 고차원 데이터 연구에 관심이있는 사람들의 질문과는 매우 다른 질문입니다.


완전히 동의 ! 묻는 질문이 다릅니다. 기능적 관점에서 파생 상품의 등록, 표시, 추정이 가능하다. 이것은 저를 설득합니다! 따라서 통계 자료에 나와있는 기능적 데이터를 다루는 것이 연속 세트에 정의 된 것이 아니라 정렬 된 세트에 색인화되어 있다는 것입니다.
로빈 지라드

주문 세트에 정의 된 것이 아닙니다. 그렇지 않으면 시계열 분석과 기능적 데이터 분석을 어떻게 구별 할 수 있습니까? @ user549은 질문 유형으로 요약한다는 점에 동의합니다. 이들은 데이터 구조에 따라 다릅니다.
vqv

15

예, 아니오 이론적 인 수준에서 두 경우 모두 유사한 기술과 프레임 워크를 사용할 수 있습니다 (가우스 프로세스 회귀 분석의 훌륭한 예).

중요한 차이점은 과적 합 (정규화)을 방지하기 위해 사용되는 가정입니다.

  • 기능적인 경우에는 일반적으로 평활도에 대한 가정이 있습니다. 즉, 서로 가까이에서 발생하는 값은 체계적으로 비슷해야합니다. 이것은 스플라인, 황토, 가우스 프로세스 등과 같은 기술의 사용으로 이어집니다.

  • 고차원의 경우, 일반적으로 희소성에 대한 가정이 있습니다. 즉, 차원의 일부만 신호를 갖습니다. 이는 해당 차원 (올가미, LARS, 슬래브 앤 스파이크 우선 등)을 식별하기위한 기술로 이어집니다.

최신 정보:

필자는 웨이블릿 / 푸리에 방법에 대해서는 생각하지 않았지만, 그러한 방법에 사용 된 임계 값 기법은 투영 된 공간의 희소성을 목표로합니다. 반대로, 일부 고차원 기법은 평활도 가정의 한 유형 인 저 차원 매니 폴드 (예 : 주성분 분석)에 대한 투영을 가정합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.