«algorithms» 태그된 질문

일련의 문제에 대한 해결책을 찾는 것과 관련된 계산 단계의 명확한 목록.

7
Quantile을 동적으로 모니터링하는 알고리즘
일부 데이터의 Quantile을 추정하고 싶습니다. 데이터가 너무 커서 메모리에 수용 할 수 없습니다. 그리고 데이터는 정적 인 것이 아니며 새로운 데이터가 계속 나오고 있습니다. 누구든지 매우 제한된 메모리 및 계산으로 지금까지 관찰 된 데이터의 Quantile을 모니터링하는 알고리즘을 알고 있습니까? 내가 찾을 수 P2 알고리즘 유용하지만, 매우 꼬리 무거운 분산되어 내 …


2
데이터의 SVD를 통해 PCA가 필요한 이유는 무엇입니까?
이 질문은 주요 구성 요소를 계산하는 효율적인 방법에 관한 것입니다. linear PCA의 많은 텍스트는 대소 문자 데이터 의 단일 값 분해를 사용하여 옹호 합니다 . 우리는 데이터가있는 경우 즉, 하고, 변수 (그 교체 할 열을 주요 구성 요소), 우리가 할 SVD : (제곱. 고유치의 뿌리), 특이 값의 주요 대각선을 점유은 …

2
상자 그림을 생성 할 수 있도록 많은 수의 샘플을 설명하는 일련의 통계를 누적 할 수 있습니까?
통계 전문가가 아니라 실습 소프트웨어 개발자이며 대학 통계 강의가 아주 오래 전에 있었다는 것을 즉시 분명히해야합니다 . 즉, 상자 그림을 생성하는 데 사용할 수있는 일련의 설명 통계를 축적하는 방법이 있는지 알고 싶습니다. 개별 샘플을 저장하지 않아도됩니까? 내가하려고하는 일은 복잡한 다중 대기열 프로세스 내에서 대기열 서비스 시간을 그래픽으로 요약 한 것입니다. …

6
숨겨진 Markov 모델 문제의 예?
나는 숨겨진 Markov 모델을 많이 읽었으며 꽤 기본적인 버전을 직접 코딩 할 수있었습니다. 그러나 내가 배우는 두 가지 주요 방법이 있습니다. 하나는 코드로 읽고 구현하는 것이며 (두 번째로) 다른 상황에서 어떻게 적용되는지 이해하는 것입니다 (그래서 작업중인 문제와 어떻게 관련이 있는지 더 잘 이해할 수 있습니다). 지금까지 수행 한 모든 예에는 …

4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
주어진 전력 및 교차 스펙트럼 밀도에서 시계열 시뮬레이션
공분산 행렬 (PSD (Power Spectral Densities) 및 CSD (Cross-Power Spectral Density))을 감안할 때 고정 색상 시계열 세트를 생성하는 데 문제가 있습니다. I는 주어진 두 개의 시계열 알 와이나는( t )yI(t)y_{I}(t) 및 와이J( t )yJ(t)y_{J}(t) 많은 널리 사용과 같은 루틴을 이용하여, I가 전력 스펙트럼 밀도 (PSD를) 및 크로스 스펙트럼 밀도 (CSD가)를 …

2
모멘트를 사용하여 정수 스트림에 대한 대략적인 Quantile을 계산합니까?
math.stackexchange 에서 마이그레이션되었습니다 . 정수의 긴 스트림을 처리하고 있으며 많은 데이터를 저장하지 않고 스트림의 다양한 백분위 수를 대략적으로 계산할 수 있도록 몇 가지 순간을 추적하는 것을 고려하고 있습니다. 잠시 후에 백분위 수를 계산하는 가장 간단한 방법은 무엇입니까? 적은 양의 데이터 만 저장하는 더 나은 방법이 있습니까?


2
PCA, LASSO, 탄력적 네트워크의 속도, 계산 비용
나는 Hastie et al. "통계학 학습 요소"(2 판), 3 장 : 서브 세트 선택 수축 방법 도출 된 입력 방향을 사용하는 방법 (PCR, PLS) 아이디어를 제공하기 위해 비교가 매우 어려울 수 있습니다. 답은 문제의 차원과 그것이 어떻게 컴퓨터 아키텍처에 적합한 지에 따라 달라질 수 있으므로 구체적인 예를 들어 500 및 …

1
극도의 무작위 숲은 무작위 숲과 어떻게 다릅니 까?
ER이보다 효율적인 구현입니까 (예 Extreme Gradient Boosting: 그래디언트 부스팅). 실제 관점과의 차이점이 중요합니까? 그것들을 구현하는 R 패키지가 있습니다. 효율성뿐만 아니라 다른 영역에서도 "일반"구현 (R의 RandomForest 패키지)을 극복하는 새로운 알고리즘입니까? 극도의 랜덤 포레스트 http://link.springer.com/article/10.1007%2Fs10994-006-6226-1

9
페어 와이즈 마할 라 노비스 거리
공변량 의 행렬 에서 모든 관측 쌍 사이의 R에서 샘플 Mahalanobis 거리를 계산해야합니다 . 효율적인 솔루션, 즉 거리 만 계산되고 바람직하게는 C / RCpp / Fortran 등으로 구현 되는 솔루션이 필요합니다 . 모집단 공분산 행렬 인 가 알려져 있지 않으며 샘플을 사용 한다고 가정합니다. 그 자리에 공분산 행렬이 있습니다.n ( …
18 r  algorithms  distance 


1
행렬에 새 행을 하나 추가 한 후 SVD 분해 업데이트
SVD 분해 A = U S V with 인 m × n 크기 의 밀도가 높은 행렬 가 있다고 가정합니다 . 에서 나는 SVD를 계산할 수 있습니다 다음과 같습니다 .AA \textbf{A}m×nm×nm \times nA=USV⊤.A=USV⊤.\mathbf{A}=\mathbf{USV}^\top.Rsvd(A) 새로운 번째 행이 A에 추가되면 SVD를 처음부터 다시 계산하지 않고 이전 행을 기반으로 새 SVD 분해를 계산할 …

3
R의 glm 함수에 어떤 최적화 알고리즘이 사용됩니까?
이러한 코드를 사용하여 R에서 로짓 회귀를 수행 할 수 있습니다. > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 최적화 알고리즘이 수렴 된 것처럼 보입니다. 피셔 스코어링 알고리즘의 단계 수에 대한 정보가 있습니다. Call: glm(formula = cbind(Menarche, Total - …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.