«algorithms» 태그된 질문

일련의 문제에 대한 해결책을 찾는 것과 관련된 계산 단계의 명확한 목록.


7
수많은 기능 (> 10K)을위한 최고의 PCA 알고리즘?
이전에 StackOverflow에서 이것을 요청했지만 SO에 대한 답변을 얻지 못한 경우 여기에서 더 적절할 것 같습니다. 통계와 프로그래밍의 교차점에 있습니다. PCA (Principal Component Analysis)를 수행하려면 코드를 작성해야합니다. 나는 잘 알려진 알고리즘을 탐색 하고이 알고리즘을 구현 했는데 NIPALS 알고리즘과 동일합니다. 처음 2-3 개의 주요 구성 요소를 찾는 데 효과적이지만 수백에서 수천 번 …

6
효율적인 온라인 선형 회귀
일반적인 선형 회귀를 수행하려는 일부 데이터를 분석하고 있지만 연속 입력 데이터 스트림 (메모리에 비해 너무 커짐)을 사용하여 온라인 설정을 처리하고 있기 때문에 불가능합니다. 소비되는 동안 모수 추정값을 업데이트합니다. 즉, 모든 것을 메모리에로드하고 전체 데이터 세트에서 선형 회귀를 수행 할 수는 없습니다. 간단한 선형 다변량 회귀 모델을 가정합니다. y = A …

9
2 차원 이진 행렬의 엔트로피 / 정보 / 패턴 측정
2 차원 이진 행렬의 엔트로피 / 정보 밀도 / 패턴 유사성을 측정하고 싶습니다. 설명을 위해 몇 가지 그림을 보여 드리겠습니다. 이 디스플레이는 다소 높은 엔트로피를 가져야합니다. 에이) 중간 엔트로피가 있어야합니다. 비) 마지막으로이 그림들은 모두 0에 가까운 엔트로피를 가져야합니다. 씨) 디) 이자형) 엔트로피를 포착하는 인덱스가 있습니까? 이 디스플레이의 "패턴 모양"? 물론, …

7
일반적인 시계열의주기 감지
이 포스트는 시계열에서 이상치 탐지 를위한 일반적인 방법 과 관련된 다른 포스트의 연속입니다 . 기본적 으로이 시점에서 나는 많은 노이즈의 영향을받는 일반적인 시계열의 주기성 / 계절성을 발견하는 강력한 방법에 관심이 있습니다. 개발자 관점에서 다음과 같은 간단한 인터페이스를 원합니다. unsigned int discover_period(vector<double> v); v샘플을 포함하는 배열은 어디에 있고 리턴 값은 신호의주기입니다. …

10
한 번의 대량 읽기 데이터 세트의 중앙값을 추정하는 데 유용한 알고리즘은 무엇입니까?
저장하기에 너무 큰 데이터 세트의 중앙값을 추정하여 각 값을 한 번만 읽을 수 있도록 (해당 값을 명시 적으로 저장하지 않는 한) 좋은 알고리즘 (최소 계산, 최소 스토리지 요구 사항)을 찾고 있습니다. 추정 할 수있는 데이터에는 한계가 없습니다. 정확도가 알려진 한 근사치가 좋습니다. 어떤 포인터?

5
랜덤 포레스트 알고리즘의 최적화 된 구현
ALGLIB, Waffles 및와 같은 R 패키지와 같은 임의의 포리스트가 구현되어 있음을 알았습니다 randomForest. 이 라이브러리가 고도로 최적화되어 있는지 아는 사람이 있습니까? 통계 학습의 요소에 자세히 설명 된대로 기본적으로 임의의 포리스트와 동등 합니까? 아니면 많은 추가 트릭이 추가 되었습니까? 이 질문이 충분히 구체적이기를 바랍니다. 내가 찾고있는 답변 유형의 삽화로 누군가 선형 …



3
숨겨진 Markov 모델과 신경망의 차이점은 무엇입니까?
통계에 발이 젖었으므로이 질문이 이해가되지 않으면 죄송합니다. Markov 모델을 사용하여 숨겨진 상태 (불공정 카지노, 주사위 롤 등) 및 신경망을 예측하여 사용자가 검색 엔진에서 클릭 한 클릭을 연구했습니다. 둘 다 우리가 관측 값을 사용하여 알아 내려고 애썼던 상태를 숨겼습니다. 이해하기 위해 둘 다 숨겨진 상태를 예측하므로 신경망에서 Markov 모델을 언제 사용할지 …

6
Monte Carlo Simulation을 사용한 대략적인
최근에 Monte Carlo 시뮬레이션을 살펴보고 (사각형 내부의 원, 비례 영역) 와 같은 상수를 근사화하는 데 사용했습니다 .ππ\pi 그러나 Monte Carlo 통합을 사용하여 [Euler 's number]의 값을 근사하는 해당 방법을 생각할 수 없습니다 .eee 이 작업을 수행하는 방법에 대한 조언이 있습니까?


1
표준 및 구형 k- 평균 알고리즘의 차이점
표준 및 구형 k- 평균 군집 알고리즘의 주요 구현 차이점은 무엇인지 이해하고 싶습니다. 각 단계에서 k- 평균은 요소 벡터와 군집 중심 사이의 거리를 계산하고 중심이 가장 가까운 군집에 문서를 재 할당합니다. 그런 다음 모든 중심이 다시 계산됩니다. 구형 k- 평균에서는 모든 벡터가 정규화되고 거리 측정 값은 코사인 비 유사성입니다. 그게 …


1
경사 하강의 종료 조건을 정의하는 방법은 무엇입니까?
실제로 그라디언트 디센트의 종료 조건을 어떻게 정의 할 수 있는지 묻고 싶었습니다. 반복 횟수, 즉 100 회 반복에 대한 매개 변수 값을 고려하여 중지 할 수 있습니까? 아니면 내가 그런 기다려야한다는 점에서 다른 두 개의 매개 변수 값 '새'와 '오래된'의 순서가 말할 수에 아주 작은 ? 시간이 많이 걸릴 것입니다.10−610−610^{-6} …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.