«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

5
임시 데이터에 적합한 클러스터링 기술?
활동 빈도에 대한 일시적인 데이터가 있습니다. 비슷한 활동 수준으로 뚜렷한 기간을 나타내는 데이터에서 클러스터를 식별하고 싶습니다. 이상적으로 는 사전에 클러스터 수를 지정 하지 않고 클러스터를 식별하고 싶습니다 . 적절한 클러스터링 기술은 무엇입니까? 질문에 대답 할 정보가 충분하지 않은 경우 적절한 클러스터링 기술을 결정하기 위해 제공해야하는 정보는 무엇입니까? 아래는 제가 상상하고있는 …

6
앙상블 방법을 구현하는 방법을 배우기위한 리소스
이론적으로는 (어떻게) 작동하는지 이해하지만 실제로 앙상블 방법을 사용하는 방법 (투표, 가중 혼합물 등)을 잘 모르겠습니다. 앙상블 메소드를 구현하기위한 좋은 리소스는 무엇입니까? 파이썬 구현과 관련된 특정 리소스가 있습니까? 편집하다: 의견에 대한 토론을 기반으로 일부를 정리하기 위해 randomForest 등과 같은 앙상블 알고리즘을 찾고 있지 않습니다. 대신 다른 알고리즘의 다른 분류를 어떻게 결합 …

3
머신 러닝의 최신 개발을 추적 할 수있는 무료로 제공되는 유용한 저널은 무엇입니까?
다른 유용한 지식 포털을 '저널'로 자유롭게 대체하십시오. 실제 응용 프로그램을 고려하여 기계 학습의 새로운 개발에 주목하고 싶습니다. 나는 (이 분야에서는 그렇지 않은) 내 자신의 작품을 출판하려는 학문이 아니지만, 실용적 수준에서 유용 할 수있는 잠재적 인 새로운 알고리즘이나 트릭을 알고 싶습니다. 유일한주의 사항은 저널 / 컨퍼런스 진행 또는 구독없이 자유롭게 사용할 …



2
머신 러닝 알고리즘에 필요한 확률의 기초를 배우는 가장 좋은 방법은 무엇입니까?
몇 년 전에 대학에서 확률 과정을 밟았지만 지금은 일부 기계 학습 알고리즘을 겪고 있으며 일부 수학은 단지 혼란 스럽습니다. 특히 현재 EM 알고리즘 (예상 최대화)을 배우고 있으며 필요한 것과 내가 가지고있는 것 사이에 큰 분리가있는 것 같습니다. 나는 책이나 웹 사이트를 요구하지 않지만, 그것들을 사용하는 알고리즘을 철저히 이해하기 위해 이러한 …

1
N-armed bandit 문제를 해결하기위한 최적의 알고리즘?
-greedy, softmax 및 UCB1과 같은 n-armed bandit 문제를 해결하기위한 많은 알고리즘에 대해 읽었지만 후회를 최소화하는 데 가장 적합한 방법을 정렬하는 데 문제가 있습니다.ϵϵ\epsilon n-armed bandit 문제를 해결하기 위해 알려진 최적의 알고리즘이 있습니까? 실제로 가장 성능이 좋은 것으로 보이는 알고리즘을 선택할 수 있습니까?

2
소수의 반 사실 사건으로 인해 희귀 성이 발생하는 경우 "희귀 한"이벤트를 통한지도 학습
시장에서 구매자와 판매자 사이의 "일치"를 관찰한다고 가정하십시오. 또한 미래의 경기를 예측하고 시장의 양쪽에 대한 추천을하는 데 사용하려는 구매자와 판매자 모두의 특성을 관찰하게됩니다. 간단히하기 위해, N 명의 구매자와 N 개의 판매자가 있고 각각이 일치하는 것을 찾는다고 가정하십시오. N 개의 일치 항목과 (N-1) (N-1)의 일치하지 않는 항목이 있습니다. 모든 것을 포함한 훈련 …

3
LASSO 솔루션 컴퓨팅을위한 GLMNET 또는 LARS?
LASSO 문제에 대한 계수를 얻고 싶습니다 || 와이− Xβ| | +λ | |β||1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. 문제는 glmnet과 lars 함수가 다른 답변을 제공한다는 것입니다. glmnet 함수의 경우 대신에 여전히 다른 답변을 얻습니다.λλ / | |와이| |λ/||Y||\lambda/||Y||λλ\lambda 이것이 예상됩니까? lars 와 glmnet 의 관계는 무엇입니까 ? glmnet이 LASSO 문제에 더 빠르다는 것을 알고 …

5
다른 길이의 시계열에 대한 SVD 차원 축소
특이 값 감소 기술로 특이 값 분해를 사용하고 있습니다. N차원이 주어진 벡터는 D상관 관계가없는 차원으로 변환 된 공간의 특징을 나타내며,이 공간의 고유 벡터에있는 데이터 정보의 대부분을 중요도가 감소하는 순서로 요약합니다. 이제이 절차를 시계열 데이터에 적용하려고합니다. 문제는 모든 시퀀스의 길이가 같지 않기 때문에 실제로 num-by-dim행렬을 만들고 SVD를 적용 할 수 없다는 …

1
랜덤 포레스트에서 왜 트리 레벨이 아닌 노드 레벨에서 기능의 랜덤 서브 세트가 선택됩니까?
내 질문 : 왜 임의 포리스트 는 트리 수준이 아닌 각 트리 내의 노드 수준 에서 분할하기 위해 기능의 임의 하위 집합을 고려 합니까? 배경 : 이것은 역사 문제입니다. 주석 캄 호 출판 이 논문을 무작위로 성장하기 위해서 사용하는 기능의 일부를 선택하여 "결정 숲을"건설에 나무를 2001 년 이후 1998 년 …

5
큰 데이터 세트에 대해 경사 하강이 왜 비효율적인가?
데이터 세트에 백만 개의 예 ( )가 포함되어 있으며, 그래디언트 디센트를 사용하여 이러한 데이터 세트에 대해 로지스틱 또는 선형 회귀를 수행하려고합니다.x1,…,x106x1,…,x106x_1, \ldots, x_{10^6} 그라디언트 디센트 방법으로 비효율적 인 것은 무엇입니까? 시간 에서의 경사 하강 단계 는 다음에 의해 주어진다는 것을 상기 하자.ttt wt+1=wt+ηt∇f(x)wt+1=wt+ηt∇f(x)w_{t+1} = w_{t} + \eta_t \nabla f(x) 여기서 …

1
순진 베이 분류 기가 0-1 손실에 최적 인 이유는 무엇입니까?
Naive Bayes 분류기는 클래스 멤버쉽 의 사후 를 최대화하여 항목 를 클래스 할당하는 분류기이며 항목 의 기능이 독립적이라고 가정합니다.xxxCCCP(C|x)P(C|x)P(C|x) 0-1 손실은 모든 잘못된 분류에 "1"의 손실과 "0"의 손실을 올바른 분류에 할당하는 손실입니다. 나는 종종 (1) "Naive Bayes"분류 기가 0-1 손실에 최적이라는 것을 읽습니다. 왜 이것이 사실입니까? (1) 하나의 예시적인 출처 …

2
공분산 함수 또는 커널-정확히 무엇입니까?
나는 가우시안 프로세스 분야에 익숙하지 않고 머신 러닝에 어떻게 적용되는지에 대해 알고 있습니다. 공분산 함수가 이러한 방법의 주요 매력 인 것에 대해 계속 읽고 듣습니다. 그렇다면 누구나 이러한 공분산 함수에서 일어나는 일을 직관적으로 설명 할 수 있습니까? 그렇지 않으면 특정 자습서 또는 설명하는 문서를 가리킬 수 있습니다.

3
인공 신경망의 이론적 결과
Coursera의 기계 학습 과정에서 인공 신경망을 방금 다루었 고 그 뒤에 더 많은 이론을 알고 싶습니다. 나는 그들이 생물학을 모방 한 동기가 다소 불만족 스럽다는 것을 안다. 표면에서 각 수준에서 공변량을 선형 조합으로 대체하는 것으로 보입니다. 반복적으로 수행함으로써 비선형 모델 피팅을 허용합니다. 이것은 왜 신경망이 때때로 비선형 모델에 적합하기를 선호하는지에 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.