«sparse» 태그된 질문

희소 행렬은 많은 요소가 0 인 행렬입니다. 이 태그는 희소성이있는 회귀 모델 또는 "희소성에 대한 베팅"원칙과 같은 다른 컨텍스트에서 희소성에 사용할 수도 있습니다.


3
희소 PCA가 PCA보다 정확히 어떻게 더 좋습니까?
수업 전에 몇 가지 강의에서 PCA에 대해 배웠고이 매혹적인 개념에 대해 더 많이 알게되면서 희소 한 PCA에 대해 알게되었습니다. 내가 틀리지 않은지 물어보고 싶었다. 이것은 희소 한 PCA이다. PCA에서, 변수 를 가진 데이터 점이 있다면 , PCA를 적용하기 전에 차원 공간 에서 각 데이터 점을 나타낼 수있다 . PCA를 적용한 …

4
매우 드문 데이터로 잘 작동하는 랜덤 포레스트 구현이 있습니까?
매우 드문 데이터로 잘 작동하는 R 임의 포리스트 구현이 있습니까? 나는 수천 또는 수백만의 부울 입력 변수를 가지고 있지만 주어진 예에서 수백 개 정도만 참입니다. R을 처음 접했고 스파 스 데이터를 처리하기위한 '매트릭스'패키지가 있지만 표준 'randomForest'패키지는이 데이터 유형을 인식하지 못하는 것 같습니다. 중요한 경우 입력 데이터는 R 외부에서 생성되어 가져옵니다. …

1
머신 러닝 알고리즘에서 누락 된 데이터와 희소 데이터의 차이점
희소 데이터와 누락 된 데이터의 주요 차이점은 무엇입니까? 기계 학습에 어떤 영향을 미칩니 까? 보다 구체적으로, 희소 데이터와 누락 된 데이터가 분류 알고리즘 및 회귀 (예측 숫자) 유형의 알고리즘에 미치는 영향. 누락 된 데이터의 백분율이 중요하고 누락 된 데이터가 포함 된 행을 삭제할 수없는 상황에 대해 이야기하고 있습니다.

1
희소 데이터 수학에서 작동하는 클러스터링 알고리즘 [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 다음과 같은 클러스터링 알고리즘 목록을 컴파일하려고합니다. R로 구현 sparseMatrix 함수에 의해 생성 된 것과 같이 희소 데이터 행렬 (유사 행렬이 아님)에서 작동합니다. CV에는이 개념을 …
18 r  clustering  sparse 

4
Norms- 특별한 점은 무엇입니까 ?
때문에 규범 (적어도 부분적으로) 고유 아닌 볼록 볼록 사이의 경계에있다. 규범은 '대부분의 스파 스'볼록 규범 (오른쪽?). p = 1 L 1L1L1L_1p=1p=1p=1L1L1L_1 나는 이해 유클리드 규범 기하학에 뿌리를 가지고 있으며, 크기가 같은 단위가 때 명확한 해석이있다. 그러나 왜 다른 실수보다 우선적으로 사용되는지 이해하지 못합니다 : ? ? 왜 전체 연속 범위를 …

1
스파 스 훈련 세트가 SVM에 부정적인 영향을 줍니까?
SVM을 사용하여 메시지를 다른 범주로 분류하려고합니다. 훈련 세트에서 원하는 단어 / 기호 목록을 작성했습니다. 메시지를 나타내는 각 벡터에 1대해 단어가 존재하면 해당 행을 설정합니다 . "corpus"는 다음과 같습니다. [mary, little, lamb, star, twinkle] 첫 번째 메시지 : "메리에게 작은 양이있었습니다"-> [1 1 0 0] 두 번째 메시지 : "twinkle little …


1
대규모 PCA도 가능합니까?
PCA (Principal Component Analysis)의 고전적인 방법은 열의 평균이 0 인 입력 데이터 매트릭스에서 수행하는 것입니다 (PCA는 "분산을 최대화 할 수 있습니다"). 컬럼을 중심으로하여 쉽게 달성 할 수 있습니다. 그러나 입력 행렬이 희소 인 경우 중심 행렬은 더 이상 희소하므로 행렬이 매우 큰 경우 더 이상 메모리에 맞지 않습니다. 스토리지 문제에 …

1
ARIMA 모델의 관측치 48에서 혁신적인 특이 치를 어떻게 통합합니까?
데이터 세트를 작업 중입니다. 일부 모델 식별 기술을 사용한 후 ARIMA (0,2,1) 모델을 만들었습니다. R detectIO의 패키지 TSA에 있는 함수를 사용하여 48 번째 원본 데이터 세트에서 혁신적인 이상치 (IO) 를 감지했습니다 . 이 특이 치를 내 모델에 어떻게 통합하여 예측 목적으로 사용할 수 있습니까? R에서 예측할 수 없기 때문에 ARIMAX …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


2
미리 지정된 희소성 패턴을 사용하여 대칭 양수 한정 행렬 생성
상관 행렬을 생성하려고합니다. p×p피×피p\times p 미리 지정된 희소성 구조를 갖는 (대칭 psd) p피p노드). 그래프에 연결된 노드는 상관 관계가 있습니다ρ∼U(0,1)ρ∼유(0,1)\rho \sim U(0,1)나머지는 모두 0이고 대각선은 모두 1입니다. 이 행렬을 여러 번 생성하려고 시도했지만 유효한 상관 관계 행렬을 거의 얻지 못했습니다. 상관 행렬 whp를 보장 할 수있는 방법이 있습니까? 긍정적 인 상관 …

1
드문 입력으로 신경망을 사용하기 위해 따라야 할 지침
입력 이미지에서 특정 기능의 위치와 같이 매우 드문 입력이 있습니다. 또한 각 기능에는 여러 감지 기능이있을 수 있습니다 (시스템 디자인과 관련이 있는지 확실하지 않음). 이 I는 그 특징의 존재를 나타내는 ON 픽셀을 가진 k 채널 '이진 이미지'로 제시 될 것이며, 그 반대도 마찬가지입니다. 우리는 그러한 입력이 매우 희박하다는 것을 알 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.