PCA, LASSO, 탄력적 네트워크의 속도, 계산 비용


18

나는 Hastie et al. "통계학 학습 요소"(2 판), 3 장 :

  1. 서브 세트 선택
  2. 수축 방법
  3. 도출 된 입력 방향을 사용하는 방법 (PCR, PLS)

아이디어를 제공하기 위해 비교가 매우 어려울 수 있습니다. 답은 문제의 차원과 그것이 어떻게 컴퓨터 아키텍처에 적합한 지에 따라 달라질 수 있으므로 구체적인 예를 들어 500 및 50 후보 회귀 분석기의 표본 크기를 고려할 수 있습니다. 나는 주로 계산 복잡성 / 추정 속도의 동기에 관심이 있지만 주어진 예제에서 특정 프로세서에 걸리는 시간은 아닙니다.


PCR 또는 PLS를 사용할 때 구성 요소의 수는 튜닝 매개 변수입니다 ( 리지 회귀 분석에서 와 유사 ). 따라서 최적의 구성 요소 수를 찾으려면 이러한 방법을 교차 검증해야합니다. LASSO에는 하나의 정규화 매개 변수가 있지만 탄력적 그물에는 2 개 (탄성 그물 = 릿지 + LASSO)가 있으므로 교차 검증이 더 비쌉니다. 그 외에도 LASSO는 폐쇄 형 솔루션이 없기 때문에 다른 모든 모델보다 적합하지 않을 수 있습니다. λ
amoeba는 Reinstate Monica가

감사합니다! 두 가지 세부 사항을 더 포함하면 좋은 답변을 얻을 수 있습니다. (2) LASSO의 속도를보다 정확하게 정량화하여 규칙적인 회귀 속도와 비교할 수 있도록합니다 (다항식, 지수 또는 선형 적으로 더 비싼 이유 및 그 이유).
Richard Hardy

불행히도, 나는 이것에 대해, 특히 (2)에 대한 준비된 대답이 없습니다. 그래서 나는 단지 의견을 남겼습니다. 그건 그렇고 +1, 5k 담당자와 축하합니다!
amoeba는

1
@amoeba, 감사합니다! 작년에 (매우 느리게) 시작할 때 5k에 도달 할 것으로 예상 할 수 없었습니다. 그러나 Cross Validated에서 활발한 활동을하는 것은 매우 신나고 보람있는 일입니다!
Richard Hardy

@amoeba, LARS 알고리즘을 사용하면 LASSO 복잡성을 파악할 수 있다고 생각합니다. 그에 따라 게시물을 업데이트했습니다. 그러나 나는 LARS 논문을주의 깊게 읽지 않았기 때문에 그것이 정확한지 확신 할 수 없다 ...
Richard Hardy

답변:


5

그룹 1 : 그룹 1
의 복잡성 / 속도는 무차별 대입 알고리즘이 사용되는지 파악하기 어렵지 않은 것으로 보입니다 ( "리프 앤 바운드"알고리즘과 같은보다 효율적인 대안이있을 수 있음). 예를 들어, 전체 집합 선택이 필요합니다 풀 주어진 적합하기 위해 회귀 분석을 K의 후보의 기능을 제공합니다. 하나의 선형 회귀에 대한 OLS 피팅은 ( 이 게시물에 따라 ) O ( K 2 n ) 의 복잡성을 가지며, 여기서 n 은 샘플 크기입니다. 따라서 무차별 완전 하위 집합 선택의 총 복잡도는 O ( 2 K 여야합니다.2케이케이영형(케이2) .영형(2케이케이2)

그룹 2 : 그룹 2
의 복잡성 / 속도는이 책의 섹션 3.8과 3.9에서 논의됩니다. 예를 들어, 주어진 페널티 λ의 능선 회귀 는 정규 회귀와 동일한 계산 복잡도를 갖습니다. 교차 검증을 사용하여 λ 를 찾아야 하므로 교차 검증에 사용되는 데이터 분할 수 (예 : S ) 에서 계산 부하가 선형으로 증가 합니다. 경우] λ의 격자 갖는 L의 포인트, 리지 회귀의 총 복잡도 동조 λ의 파라미터 것이다 O ( L S K 2 N ) .λλ에스λλ영형(에스케이2)
λλ영형(에스케이2)
영형(에스케이2)α

그룹 3 :
나는 아직도 그리워 주성분 회귀 (PCR)과 부분 최소 제곱 (PLS)으로 구성되어 그룹 3의 복잡성 / 속도에 어떤 메모를.


2

위의 그룹 3에 대한 질문 2의 한 부분 (즉, PLS)에만 해당되지만 그럼에도 불구하고 유익 할 수 있습니다. Srinivasan et al (2010, 기술 보고서; https://www.umiacs.umd.edu/~balajiv/Papers/ 참조) UMD_CS_TR_Pls_Gpu.pdf )는 NIPALS 알고리즘을 사용하여 PLS에서 일부 측정을 수행했습니다.이 알고리즘의 시간 및 공간 복잡도는 O (dN)-추출 및 추출을 위해 서로 다른 모델에 포함합니다. ) 얼굴 인식. 자체 GPU 기반 구현을 사용하여 측정을 수행했습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.