«algorithms» 태그된 질문

일련의 문제에 대한 해결책을 찾는 것과 관련된 계산 단계의 명확한 목록.

1
알고리즘 : 값이 확실하지 않은 경우 이진 검색
각 단계의 테스트에서 잘못된 결과가 나올 때 이진 검색을 수행하는 알고리즘이 필요합니다. 배경 : 학생들을 12 가지 난이도 수준 중 가장 적절한 곳에 배치해야합니다. 현재의 접근 방식은 무차별 적이며 난이도 증가, 세 가지 잘못 후 중단 floor((score - 1) / 5) + 1, 최소 1의 수준으로 학생을 배치하는 60 가지의 …
11 algorithms 


2
실제 머신 러닝에 관한 모든 것이 무엇입니까?
나는 기계 학습 (일부 통계)의 새로운 이민자이며, 학습 지식 (감독 / 감독되지 않은 학습 알고리즘, 관련 최적화 방법, 정규화, 일부 철학 (예 : 편향 분산 절충)?)입니다. 나는 실제 연습이 없으면 기계 학습에 대한 깊은 이해를 얻지 못할 것이라는 것을 알고 있습니다. 따라서 실제 데이터에 대한 분류 문제부터 시작합니다 (예 : …

1
기대 극대화 설명
EM 알고리즘 에 관한 매우 유용한 튜토리얼을 찾았습니다 . 튜토리얼의 예제와 그림은 단순히 훌륭합니다. 확률 계산에 대한 관련 질문 기대 최대화가 어떻게 작동합니까? 튜토리얼에 설명 된 이론을 예제에 연결하는 방법에 관한 또 다른 질문이 있습니다. 전자 단계에서, EM 함수를 선택 그 하한은 로그 P ( X , Θ ) 도처하고있는 …

3
Nelder Mead의 기준 중지
함수 최적화를 위해 Nelder-Mead 알고리즘을 구현하려고합니다. Nelder-미드에 대한 위키 페이지 의 정지 기준을 제외하고, 전체 알고리즘에 대한 놀라 울 정도로 분명하다. 슬프게도 다음과 같이 말합니다. 수렴을 확인하십시오 [설명 필요] . 나는 두 가지 기준을 직접 시도하고 테스트했다. 중지하면 f(xN+1)−f(x1)&lt;ϵ에프(엑스엔+1)−에프(엑스1)&lt;ϵf(x_{N+1}) - f(x_1) < \epsilon 여기서 ϵϵ\epsilon 작고, 여기서 은 IS 번째 …

2
의사 결정 트리를 갖춘 이유는 무엇입니까?
분류 작업 및 특히 Adaboost에 대한 부스팅 알고리즘에 대해 조금 읽었습니다. Adaboost의 목적은 여러 "약한 학습자"를 대상으로하고 훈련 데이터에 대한 일련의 반복을 통해 분류자를 밀어 모델 (들)이 반복적으로 실수를 저지르는 클래스를 예측하는 법을 배우도록하는 것입니다. 그러나 내가 한 많은 독서가 왜 의사 결정 트리를 약한 분류기로 사용했는지 궁금합니다. 특별한 이유가 …

2
신경망의 VC 치수 계산
나는와 시그 모이 뉴런의 일부 고정이 아닌 재발 (DAG) 토폴로지 (노드와 가장자리의 고정 세트하지만, 학습 알고리즘은 가장자리에 무게를 다를 수 있음)이있는 경우 단지에서 문자열을 할 수있는 입력 뉴런 { - 1 , 1 } n 을 입력으로하여 하나의 출력으로 이어집니다 (실제 값은 0에서 멀어지고 특정 고정 임계 값 인 경우 …

4
k- 평균의 구현을 어떻게 테스트합니까?
면책 조항 : 나는이 질문을 Stackoverflow에 게시했지만 이것이이 플랫폼에 더 적합하다고 생각했습니다. 다차원 데이터 세트에 대한 고유 한 k- 평균 구현을 어떻게 테스트합니까? 데이터에 이미 존재하는 구현 (예 : Matlab)을 실행하고 결과를 내 알고리즘과 비교할 생각이었습니다. 그러나 이것은 두 알고리즘이 거의 동일하게 작동해야하며 두 결과 사이의 매핑은 아마도 케이크 조각이 …

1
대규모 PCA도 가능합니까?
PCA (Principal Component Analysis)의 고전적인 방법은 열의 평균이 0 인 입력 데이터 매트릭스에서 수행하는 것입니다 (PCA는 "분산을 최대화 할 수 있습니다"). 컬럼을 중심으로하여 쉽게 달성 할 수 있습니다. 그러나 입력 행렬이 희소 인 경우 중심 행렬은 더 이상 희소하므로 행렬이 매우 큰 경우 더 이상 메모리에 맞지 않습니다. 스토리지 문제에 …

2
이상 감지 : 어떤 알고리즘을 사용해야합니까?
컨텍스트 : 임상 데이터를 분석하여 오타가 될 수없는 데이터를 필터링하는 시스템을 개발 중입니다. 내가 지금까지 한 일 : 타당성을 정량화하기 위해 지금까지의 시도는 데이터를 정규화 한 다음 세트 D에서 알려진 데이터 포인트까지의 거리를 기준으로 포인트 p에 대한 타당성 값을 계산하는 것입니다 (= 훈련 세트). 타당성 ( p ) = ∑큐∈ …

3
최소한의 메모리를 사용하여 데이터를 훈련하는 가장 효율적인 방법은 무엇입니까?
이것은 내 훈련 데이터입니다 : 200,000 예제 x 10,000 기능. 내 훈련 데이터 매트릭스는-200,000 x 10,000입니다. 각 예제의 기능을 생성 할 때마다 모든 데이터 세트를 하나씩 저장하여 메모리 문제없이 플랫 파일로 저장했습니다. 그러나 이제 Milk , SVM light 또는 기타 기계 학습 알고리즘을 사용하면 모든 것이 학습 데이터 대신 하나씩 …

4
이메일 주소에서 준 난수로 [닫힘]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 2 년 전 . 나의 목표: 전자 메일 주소를 사용하여 준 난수 1, 2, 3 또는 4를 출력하는 기능을 갖고 싶습니다. 약간의 세부 사항 : 준 난수 …

3
순위 지정을위한 기계 학습 알고리즘
나는 요소의 집합을 가지고 엑스XX 내가 설명 할 수있는 엔nn형질. 그러므로: 엑스나는: {씨나는 1,씨나는 2, ... ,씨나는 n} ∣엑스나는∈ Xxi:{ci1,ci2,…,cin}∣xi∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X 어디 씨나는 jcijc_{ij} 요소에 대한 (숫자) 평가 나는ii 특성에 따라 제이jj. 내 요소는 점으로 볼 수 있습니다nnn 차원 공간. 내 독서에 따르면, …

1
샘플링 비용
다음과 같은 시뮬레이션 문제가 발생했습니다. {ω1,…,ωd}{ω1,…,ωd}\{\omega_1,\ldots,\omega_d\} 알려진 실수의 분포 {−1,1}d{−1,1}d\{-1,1\}^d 에 의해 정의 P(X=(x1,…,xd))∝(x1ω1+…+xdωd)+P(X=(x1,…,xd))∝(x1ω1+…+xdωd)+\mathbb{P}(X=(x_1,\ldots,x_d))\propto (x_1\omega_1+\ldots+x_d\omega_d)_+ 어디 (z)+(z)+(z)_+ 의 긍정적 인 부분을 나타냅니다 zzz. 이 분포를 대상으로하는 Metropolis-Hastings 샘플러는 생각할 수 있지만 알고리즘의 순서를 줄이기 위해 많은 수의 제로 확률을 사용하는 효율적인 직접 샘플러가 있는지 궁금합니다.O(2d)O(2d)O(2^d) 에 O(d)O(d)O(d).

2
잘린 다항 분포를 샘플링하는 방법은 무엇입니까?
잘린 다항 분포를 샘플링하는 알고리즘이 필요합니다. 그건, x⃗ ∼1Zpx11…pxkkx1!…xk!x→∼1Zp1x1…pkxkx1!…xk!\vec x \sim \frac{1}{Z} \frac{p_1^{x_1} \dots p_k^{x_k}}{x_1!\dots x_k!} 여기서 는 정규화 상수이고 에는 양의 성분이 있으며 입니다. 범위 의 값만 고려합니다 .ZZZx⃗ x→\vec xkkk∑xi=n∑xi=n\sum x_i = nx⃗ x→\vec{x}a⃗ ≤x⃗ ≤b⃗ a→≤x→≤b→\vec a \le \vec x \le \vec b 이 잘린 다항 분포를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.