«algorithms» 태그된 질문

알고리즘은 계산 된 결과를 생성하는 하나 이상의 계산 집합입니다. 모든 통계 방법은 알고리즘입니다. 알고리즘은 백분율 계산과 같이 간단 할 수도 있고 매우 복잡 할 수도 있고 빠르고 정확한 결과를 위해 컴퓨터가 필요할 수도 있습니다.

5
모델 언더 핏은 언제입니까?
논리는 종종 모델에 적합하지 않음으로써 일반화 할 수있는 능력이 증가한다고 말합니다. 즉, 어느 시점에서 모델에 적합하지 않으면 데이터의 복잡성에 관계없이 모델이 더 나 빠지게됩니다. 모델이 올바른 균형을 강타했고 모델링하려는 데이터에 적합하지 않은 시점을 어떻게 알 수 있습니까? 참고 : 이것은 " 왜 과적 합이 나쁜가? " 라는 질문에 대한 후속 …

3
사용시기-기계 학습 [폐쇄]
최근 UPC / Barcelona의 Oriol Pujol 교수의 기계 학습 수업에서 그는 광범위한 기계 학습 관련 작업에 사용할 가장 일반적인 알고리즘, 원리 및 개념을 설명했습니다. 여기서 나는 당신과 그것들을 공유하고 당신에게 묻습니다. 다양한 유형의 기계 학습 관련 문제와 관련된 접근 방식 또는 방법과 포괄적 인 프레임 워크 일치 작업이 있습니까? 간단한 …


5
의사 결정 트리 알고리즘이 선형 또는 비선형입니까?
최근 내 친구가 인터뷰에서 의사 결정 트리 알고리즘이 선형 또는 비선형 알고리즘인지 물었습니다. 이 질문에 대한 답을 찾으려고했지만 만족스러운 설명을 찾지 못했습니다. 누구 든지이 질문에 대한 해결책에 대답하고 설명 할 수 있습니까? 또한 비선형 기계 학습 알고리즘의 다른 예는 무엇입니까?

3
알고리즘 개발을 확장하는 방법?
탐색 적 데이터 분석 및 알고리즘 개발에서 대부분의 시간은 시각화, 코드 작성, 작은 데이터 세트에서 실행, 반복의주기에 소비됩니다. 내가 데이터는 컴퓨터 비전 / 센서 융합 유형 인 경향이 있고, 알고리즘은 시력이 무겁고 (예를 들어 객체 감지 및 추적 등), 기성 알고리즘은이 맥락에서 작동하지 않습니다. 나는 이것이 많은 반복 (예 : …
18 algorithms 

1
텍스트 클러스터링 알고리즘
의미에 따라 많은 양의 문장을 그룹으로 묶는 데 문제가 있습니다. 이것은 문장이 많고 그 의미를 기준으로 그룹화하려는 경우의 문제와 유사합니다. 이를 위해 어떤 알고리즘이 제안됩니까? 나는 미리 많은 수의 클러스터를 알지 못하고 (더 많은 데이터가 나올수록 클러스터가 변경 될 수 있음) 각 문장을 나타내는 데 일반적으로 어떤 기능이 사용됩니까? 이제 …

4
유사성 점수를 기반으로 한 클러스터링
두 요소 ei, ej ∈ E 사이 에 요소 E 와 유사성 ( 거리가 아닌 ) 함수 sim (ei, ej) 가 있다고 가정합니다 . sim을 사용하여 E 의 요소를 어떻게 효율적으로 클러스터링 할 수 있습니까? k는 예를 들면, 소정의 요구 -means k는 캐노피 클러스터링 개의 임계치를 필요로한다. 사전 정의 된 …

2
Mahout의 항목 기반 및 사용자 기반 권장 사항 차이
사용자 기반과 항목 기반 권장 사항이 정확히 어떻게 다른지 알고 싶습니다. 그것은 정의 사용자 기반 : 유사한 사용자를 찾아 항목을 추천합니다. 사용자의 동적 특성으로 인해 확장이 어려운 경우가 많습니다. 아이템 기반 : 아이템 간의 유사성을 계산하고 추천합니다. 일반적으로 항목은 많이 변경되지 않으므로 오프라인으로 계산할 수 있습니다. 그러나 두 가지 종류의 …

2
K- 평균 대 온라인 K- 평균
K- 평균 은 클러스터링을위한 잘 알려진 알고리즘이지만 이러한 알고리즘의 온라인 변형 (온라인 K- 평균)도 있습니다. 이러한 접근법의 장단점은 무엇이며 각각 선호하는시기는 언제입니까?

2
분리 된 분류기의 앙상블로 구성된 분류기에 대한 ROC 곡선을 계산하는 효율적인 알고리즘
분류기 C_1 ... C_n이 있다고 가정합니다. 두 입력자가 동일한 입력 (예 : 의사 결정 트리의 노드)에서 true를 반환하지 않는다는 점에서 분리되어 있습니다. 나는 이들의 일부 하위 집합을 통합하는 새로운 분류기를 만들고 싶습니다 (예 : 긍정적 인 분류를 제공하기 위해 의사 결정 트리의 잎을 결정하고 싶습니다). 물론, 그렇게 할 때 민감도와 …
13 algorithms 

1
전역 압축 방법과 범용 압축 방법의 차이점은 무엇입니까?
압축 방법은 두 가지 주요 세트로 나눌 수 있음을 이해합니다. 글로벌 현지 첫 번째 세트는 처리중인 데이터에 관계없이 작동합니다. 즉, 데이터의 특성에 의존하지 않으므로 데이터 세트의 일부 (압축 자체 이전)에서 사전 처리를 수행 할 필요가 없습니다. 반면에 로컬 방법은 데이터를 분석하여 일반적으로 압축률을 향상시키는 정보를 추출합니다. 이 방법들 중 일부에 …

1
문자 순서가 영어 단어인지 잡음인지 확인하는 방법
향후 예측을 위해 단어 목록에서 어떤 종류의 기능을 추출하려고 시도합니까? 기존 단어입니까 아니면 문자 혼란입니까? 내가 찾은 작업에 대한 설명 이 있습니다. 주어진 단어가 영어인지 대답 할 수있는 프로그램을 작성해야합니다. 사전에서 단어를 찾아보기 만하면 되기는 쉽지만 중요한 제한이 있습니다. 프로그램이 64KiB를 넘지 않아야합니다. 따라서 문제를 해결하기 위해 로지스틱 회귀를 사용할 …

2
희소 데이터로 방정식 시스템 풀기
40 개의 독립 변수 (x1, ..., x40)와 하나의 종속 변수 (y)가있는 일련의 방정식을 풀려고합니다. 총 방정식 수 (행 수)는 ~ 300이며 y와 예측 값 사이의 총 제곱합 오류를 최소화하는 40 계수 세트로 풀고 싶습니다. 내 문제는 행렬이 매우 희박하고 희소 데이터로 방정식 시스템을 푸는 가장 좋은 방법을 모른다는 것입니다. 데이터 …

1
R의 MLE에 대한 피셔 득점 v / s 좌표 하강
R 기본 함수 glm()는 MLE에 Fishers Scoring glmnet을 사용하는 반면 좌표 하강 법을 사용하여 동일한 방정식을 해결하는 것으로 보입니다. Fisher Scoring이 다른 행렬 연산 외에도 2 차 미분 행렬을 계산하므로 좌표 강하는 Fisher Scoring보다 시간 효율적입니다. 좌표 하강은 O (np) 시간에 동일한 작업을 수행 할 수 있지만 수행 비용이 많이 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.