통계 및 빅 데이터 sparse

7

나는 우리가 다차원적이고 희소 한 데이터를 가질 때 고전적인 거리 (유클리드 거리와 같은)가 약하게 구별되는 곳을 보았다. 왜? 유클리드 거리가 잘 수행되지 않는 두 개의 희소 데이터 벡터의 예가 있습니까? 이 경우 어떤 유사성을 사용해야합니까?

72 machine-learning clustering data-mining sparse euclidean

3

희소 PCA가 PCA보다 정확히 어떻게 더 좋습니까?

수업 전에 몇 가지 강의에서 PCA에 대해 배웠고이 매혹적인 개념에 대해 더 많이 알게되면서 희소 한 PCA에 대해 알게되었습니다. 내가 틀리지 않은지 물어보고 싶었다. 이것은 희소 한 PCA이다. PCA에서, 변수 를 가진 데이터 점이 있다면 , PCA를 적용하기 전에 차원 공간 에서 각 데이터 점을 나타낼 수있다 . PCA를 적용한 …

24 machine-learning pca sparse

4

매우 드문 데이터로 잘 작동하는 랜덤 포레스트 구현이 있습니까?

매우 드문 데이터로 잘 작동하는 R 임의 포리스트 구현이 있습니까? 나는 수천 또는 수백만의 부울 입력 변수를 가지고 있지만 주어진 예에서 수백 개 정도만 참입니다. R을 처음 접했고 스파 스 데이터를 처리하기위한 '매트릭스'패키지가 있지만 표준 'randomForest'패키지는이 데이터 유형을 인식하지 못하는 것 같습니다. 중요한 경우 입력 데이터는 R 외부에서 생성되어 가져옵니다. …

23 r random-forest sparse

1

머신 러닝 알고리즘에서 누락 된 데이터와 희소 데이터의 차이점

희소 데이터와 누락 된 데이터의 주요 차이점은 무엇입니까? 기계 학습에 어떤 영향을 미칩니 까? 보다 구체적으로, 희소 데이터와 누락 된 데이터가 분류 알고리즘 및 회귀 (예측 숫자) 유형의 알고리즘에 미치는 영향. 누락 된 데이터의 백분율이 중요하고 누락 된 데이터가 포함 된 행을 삭제할 수없는 상황에 대해 이야기하고 있습니다.

20 machine-learning dataset missing-data sparse

1

희소 데이터 수학에서 작동하는 클러스터링 알고리즘 [닫기]

닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 다음과 같은 클러스터링 알고리즘 목록을 컴파일하려고합니다. R로 구현 sparseMatrix 함수에 의해 생성 된 것과 같이 희소 데이터 행렬 (유사 행렬이 아님)에서 작동합니다. CV에는이 개념을 …

18 r clustering sparse

4

Norms- 특별한 점은 무엇입니까 ?

때문에 규범 (적어도 부분적으로) 고유 아닌 볼록 볼록 사이의 경계에있다. 규범은 '대부분의 스파 스'볼록 규범 (오른쪽?). p = 1 L 1L1L1L_1p=1p=1p=1L1L1L_1 나는 이해 유클리드 규범 기하학에 뿌리를 가지고 있으며, 크기가 같은 단위가 때 명확한 해석이있다. 그러나 왜 다른 실수보다 우선적으로 사용되는지 이해하지 못합니다 : ? ? 왜 전체 연속 범위를 …

13 regression regularization sparse

1

스파 스 훈련 세트가 SVM에 부정적인 영향을 줍니까?

SVM을 사용하여 메시지를 다른 범주로 분류하려고합니다. 훈련 세트에서 원하는 단어 / 기호 목록을 작성했습니다. 메시지를 나타내는 각 벡터에 1대해 단어가 존재하면 해당 행을 설정합니다 . "corpus"는 다음과 같습니다. [mary, little, lamb, star, twinkle] 첫 번째 메시지 : "메리에게 작은 양이있었습니다"-> [1 1 0 0] 두 번째 메시지 : "twinkle little …

12 classification svm sparse

1

규범 은 무엇이며 정규화와 어떤 관련이 있습니까?

나는 최근에 드문 드문 표현에 대한 많은 논문을 보았으며, 대부분은 규범을 사용하고 약간의 최소화를 수행합니다. 내 질문은 규범과 혼합 규범은 무엇입니까? 그리고 정규화와 어떤 관련이 있습니까?ℓpℓp\ell_pℓpℓp\ell_pℓp,qℓp,q\ell_{p, q} 감사

12 machine-learning regularization sparse

1

대규모 PCA도 가능합니까?

PCA (Principal Component Analysis)의 고전적인 방법은 열의 평균이 0 인 입력 데이터 매트릭스에서 수행하는 것입니다 (PCA는 "분산을 최대화 할 수 있습니다"). 컬럼을 중심으로하여 쉽게 달성 할 수 있습니다. 그러나 입력 행렬이 희소 인 경우 중심 행렬은 더 이상 희소하므로 행렬이 매우 큰 경우 더 이상 메모리에 맞지 않습니다. 스토리지 문제에 …

10 pca algorithms dimensionality-reduction large-data sparse

1

ARIMA 모델의 관측치 48에서 혁신적인 특이 치를 어떻게 통합합니까?

데이터 세트를 작업 중입니다. 일부 모델 식별 기술을 사용한 후 ARIMA (0,2,1) 모델을 만들었습니다. R detectIO의 패키지 TSA에 있는 함수를 사용하여 48 번째 원본 데이터 세트에서 혁신적인 이상치 (IO) 를 감지했습니다 . 이 특이 치를 내 모델에 어떻게 통합하여 예측 목적으로 사용할 수 있습니까? R에서 예측할 수 없기 때문에 ARIMAX …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

4

확률 적 행렬에 대한 희소성 유도 정규화

(예를 들어, 압축 감지 분야에서) 규범이 기능을 최소화하면 (고정 행렬 및 벡터 ) 라는 의미에서 "희소성 유발" 이라는 것은 잘 알려져 있습니다 충분히 큼 \ lambda> 0 이면 A , \ vec {b} 및 \ lambda 중 많은 항목이 결과 \ vec {x} 에 정확히 0이 아닌 항목을 많이 가질 …

10 regression matrix normalization regularization sparse

2

미리 지정된 희소성 패턴을 사용하여 대칭 양수 한정 행렬 생성

상관 행렬을 생성하려고합니다. p×p피×피p\times p 미리 지정된 희소성 구조를 갖는 (대칭 psd) p피p노드). 그래프에 연결된 노드는 상관 관계가 있습니다ρ∼U(0,1)ρ∼유(0,1)\rho \sim U(0,1)나머지는 모두 0이고 대각선은 모두 1입니다. 이 행렬을 여러 번 생성하려고 시도했지만 유효한 상관 관계 행렬을 거의 얻지 못했습니다. 상관 행렬 whp를 보장 할 수있는 방법이 있습니까? 긍정적 인 상관 …

9 correlation matrix sparse correlation-matrix

1

드문 입력으로 신경망을 사용하기 위해 따라야 할 지침

입력 이미지에서 특정 기능의 위치와 같이 매우 드문 입력이 있습니다. 또한 각 기능에는 여러 감지 기능이있을 수 있습니다 (시스템 디자인과 관련이 있는지 확실하지 않음). 이 I는 그 특징의 존재를 나타내는 ON 픽셀을 가진 k 채널 '이진 이미지'로 제시 될 것이며, 그 반대도 마찬가지입니다. 우리는 그러한 입력이 매우 희박하다는 것을 알 …

9 neural-networks deep-learning sparse

2

회귀에 포함 할 희소 주성분 수 선택

회귀 모델에 포함 할 희소 주성분 수를 선택하는 방법에 대한 경험이 있습니까?

9 pca sparse regression-strategies

«sparse» 태그된 질문