«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
약한 학습자의“강점”
앙상블 학습 (예 : 부스팅)에서 약한 학습자와 관련하여 몇 가지 밀접한 관련 질문이 있습니다. 이것은 바보처럼 들릴지 모르지만 강한 학습자와 반대로 약한 것을 사용하면 어떤 이점이 있습니까? (예 : "강력한"학습 방법으로 부스트하지 않는 이유는 무엇입니까?) 약한 학습자에게 어떤 종류의 "최적의"힘이 있습니까 (예 : 다른 모든 앙상블 파라미터를 고정 된 상태로 …

3
다변량 시계열 예측을위한 벡터 회귀 지원
지원 벡터 회귀를 사용하여 시계열 예측을 시도한 사람이 있습니까? 지원 벡터 시스템을 이해하고 지원 벡터 회귀를 부분적으로 이해하지만 시계열, 특히 다변량 시계열을 모델링하는 데 어떻게 사용할 수 있는지 이해하지 못합니다. 몇 가지 논문을 읽으려고했지만 너무 높은 수준입니다. 누구나 다변량 시계열과 관련하여 작동 방식을 평온하게 설명 할 수 있습니까? 편집 : …

9
신경망 예측의 신뢰도를 결정하는 방법은 무엇입니까?
내 질문을 설명하기 위해 입력에 잡음이 있지만 출력이없는 훈련 세트가 있다고 가정하십시오. # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] 여기서 출력은 노이즈가없는 경우 (실제 그래디언트가 아닌) 입력 어레이의 그래디언트입니다. 네트워크를 …

2
모든 머신 러닝 알고리즘이 데이터를 선형 적으로 분리합니까?
저는 프로그래밍과 머신 러닝을 좋아합니다. 몇 달 전만해도 기계 학습 프로그래밍에 대해 배우기 시작했습니다. 정량적 인 과학 배경이없는 많은 사람들과 마찬가지로 저도 널리 사용되는 ML 패키지 (캐럿 R)의 알고리즘과 데이터 세트를 다루면서 ML에 대해 배우기 시작했습니다. 얼마 전 저는 ML에서 선형 회귀 사용에 대해 이야기하는 블로그를 읽었습니다. 내가 올바로 기억하고 …

2
탄력적 순 로지스틱 회귀 분석에서 최적의 알파 선택
0에서 1 사이 glmnet의 그리드에서 람다 값을 선택하여 R 의 패키지를 사용하여 건강 관리 데이터 세트에서 탄력적 그물 로지스틱 회귀를 수행하고 있습니다. 약식 코드는 다음과 같습니다.αα\alpha alphalist <- seq(0,1,by=0.1) elasticnet <- lapply(alphalist, function(a){ cv.glmnet(x, y, alpha=a, family="binomial", lambda.min.ratio=.001) }) for (i in 1:11) {print(min(elasticnet[[i]]$cvm))} 씩 증가하면서 에서 까지의 각 알파 …

3
Lars와 Glmnet은 왜 Lasso 문제에 대해 다른 솔루션을 제공합니까?
R 패키지 Lars와 GlmnetLasso 문제를 해결하는 데 사용되는 R 패키지를 더 잘 이해하고 싶습니다 . ( 변수 및 샘플의 경우, 참조 www.stanford.edu/~hastie/Papers/glmnet.pdf를 ) 3 페이지pN해요 난 N( β0β) ∈ Rp + 1[ 12 N∑나는 = 1엔( y나는− β0− x티나는β)2+ λ | | β| |엘1]엠나는엔(β0β)∈아르 자형피+1[12엔∑나는=1엔(와이나는−β0−엑스나는티β)2+λ||β||엘1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + …

8
특징 별 데이터가 아닌 거리 행렬만으로 K- 평균 (또는 가까운 친척) 클러스터링 수행
내가 가진 객체에서 K- 평균 군집화를 수행하고 싶지만 객체가 공간의 포인트, 즉 objects x features데이터 세트 로 설명되지 않습니다 . 그러나 두 객체 사이의 거리를 계산할 수 있습니다 (유사 기능을 기반으로 함). 그래서 나는 거리 행렬을 폐기합니다 objects x objects. 이전에 K- 평균을 구현했지만 포인트 데이터 세트 입력이있었습니다. 거리 매트릭스 …

4
Angry Birds를 플레이하기위한 머신 러닝 시스템을 어떻게 설계 하시겠습니까?
너무 많은 앵그리 버드를 플레이 한 후, 나는 내 전략을 관찰하기 시작했습니다. 각 레벨에서 별 3 개를 얻는 데 매우 구체적인 접근 방식을 개발 한 것으로 나타났습니다. 앵그리 버드를 플레이 할 수있는 머신 러닝 시스템을 개발해야하는 어려움에 대해 궁금해했습니다. 게임과 상호 작용하고 새를 시작하는 것은 사소한 일입니다. 그러나 제가 가진 …

1
one-hot 인코딩을 사용할 때 열 중 하나를 삭제
기계 학습에서 동일한 정보를 효과적으로 인코딩하기 때문에 데이터 세트에 상관 관계가 높은 기능이 있으면 문제가 될 수 있습니다. 최근 누군가 범주 형 변수에 대해 원핫 인코딩을 수행하면 관련 기능이 생겨서 그 중 하나를 "참조"로 삭제해야한다고 지적했습니다. 예를 들어 성별을 두 변수로 인코딩하면 is_male과 is_female음의 상관 관계를 갖는 두 가지 기능이 …

4
머신 러닝 또는 딥 러닝 알고리즘을 사용하여 MCMC 기술의 샘플링 프로세스를 "향상"할 수 있습니까?
MCMC (Markov chain Monte Carlo) 방법에 대한 약간의 지식을 바탕으로 샘플링이 앞에서 언급 한 기술의 중요한 부분임을 이해합니다. 가장 일반적으로 사용되는 샘플링 방법은 Hamiltonian과 Metropolis입니다. 보다 효율적인 MCMC 샘플러를 구성하기 위해 머신 러닝 또는 딥 러닝을 활용할 수있는 방법이 있습니까?

2
연속적인 독립 변수 / 기능을 언제 이산 / 빈화해야합니까?
언제 독립 변수 / 기능을 이산 / 빈화해야하고 언제 안됩니까? 질문에 대답하려는 나의 시도 : 비닝은 정보를 잃을 것이기 때문에 일반적으로 비닝해서는 안됩니다. 비닝은 실제로 모형의 자유도를 증가 시키므로 비닝 후에 초과 피팅을 유발할 수 있습니다. "높은 바이어스"모델이있는 경우 비닝이 나쁘지는 않지만 "높은 분산"모델이있는 경우 비닝을 피해야합니다. 사용중인 모델에 따라 …

2
제한된 Boltzmann 기계 : 기계 학습에 어떻게 사용됩니까?
배경: 예, RBM (Restricted Boltzmann Machine)을 사용하여 신경망의 가중치를 시작할 수 있습니다. 또한 "신속한 계층"방식으로 심층 네트워크를 구축 (즉, 최상위 계층에서 번째 계층 을 학습 한 다음 의 상단 층 번째 번째 층 헹군 반복 ...)( N - 1 ) , N + 1 , Nnnn(n−1)(n−1)(n-1)n+1n+1n+1nnn . RBM 사용 방법에 …

5
과적 합 :은 총알이 없습니까?
올바른 교차 검증 및 모델 선택 절차를 따를 때에도 모델 복잡성, 기간에 제한을 두지 않는 한 모델을 충분히 검색 하지 않으면 과적 합 이 발생 한다는 것을 이해 합니다. 더욱이 사람들은 종종 그들이 제공 할 수있는 보호를 약화시키는 데이터로부터 모델 복잡성에 대한 처벌을 배우려고 시도합니다. 내 질문은 : 위의 진술에 …

4
“반 감독 학습”– 이것이 과적입니까?
Kaggle 경쟁에서 승리 한 솔루션에 대한 보고서를 읽고있었습니다 ( Malware Classification ). 보고서는이 포럼 게시물 에서 찾을 수 있습니다 . 문제는 열차 세트에 10000 개의 요소, 테스트 세트에 10000 개의 요소가있는 분류 문제 (9 개의 클래스, 메트릭은 로그 손실)였습니다. 경쟁하는 동안 모델은 테스트 세트의 30 %에 대해 평가되었습니다. 또 다른 …

1
ROC 곡선 분석을위한 베이지안 방법을 발명 한 적이 있습니까?
전문 이것은 긴 글입니다. 이 내용을 다시 읽는다면 배경 자료는 동일하게 유지되지만 질문 부분을 수정했습니다. 또한 문제에 대한 해결책을 고안했다고 생각합니다. 해당 솔루션은 게시물 하단에 나타납니다. 내 원래 솔루션 (이 게시물에서 편집; 해당 솔루션의 편집 기록 참조)이 반드시 바이어스 된 추정치를 생성했음을 지적한 CliffAB에게 감사합니다. 문제 기계 학습 분류 문제에서 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.