«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

3
숨겨진 Markov 모델 임계 값
mfcc 및 숨겨진 마르코프 모델을 사용하여 사운드 인식을위한 개념 증명 시스템을 개발했습니다. 알려진 사운드에서 시스템을 테스트 할 때 유망한 결과를 제공합니다. 시스템은 알려지지 않은 사운드가 입력 될 때 가장 근접한 결과를 반환하고 악보를 결정하기 위해 점수가 그다지 명확하지 않습니다. 예 : 나는 숨은 마르코프 모델 3 개를 연설 용으로, 하나는 …

2
다양한 기능을 가진 데이터 세트 다루기
다양한 수의 기능으로 데이터를 분류하는 방법에는 어떤 것이 있습니까? 예를 들어, 각 데이터 포인트가 x 및 y 포인트의 벡터이고 각 인스턴스에 대해 동일한 개수의 포인트가없는 문제를 고려하십시오. x와 y 포인트의 각 쌍을 특징으로 취급 할 수 있습니까? 또는 각 데이터 포인트에 고정 된 수의 기능이 있도록 포인트를 어떻게 든 요약해야합니까?

3
학교 어린이에게 통계 및 기계 학습에 대해 무엇을 말할 수 있습니까?
다음 주에 우리는 집에있는 지역 학교에서 인턴을하였습니다. 그의 짧은 인턴십의 개념은 실제 세계가 어떻게 작동하는지, 어떤 직업이 어떻게 처리하는지, 매일의 업무가 어떻게 보이는지 등을 이해하는 것입니다. 이제 나는 그런 어린 아이에게 통계 및 기계 학습에 대해 말하고 보여주고 설명 할 수있는 것이 무엇인지 궁금해했습니다. 이 분야의 기본 아이디어를 얻습니다 열광적이다 …

2
기계 학습을 위해 범주 형 기능을 숫자로 인코딩
신경망과 같은 많은 기계 학습 알고리즘은 숫자를 처리 할 것으로 예상합니다. 따라서 범주 형 데이터가 있으면 변환해야합니다. 범주 적으로 말하자면, 예를 들어 : 자동차 브랜드 : Audi, BMW, Chevrolet ... 사용자 ID : 1, 25, 26, 28 ... 사용자 ID는 숫자이지만 레이블 일 뿐이며 연령이나 금액과 같은 연속성 측면에서 아무 …

1
언밸런스 드 클래스 오버 / 언더 샘플링시 정확도를 극대화하는 것은 오 분류 비용을 최소화하는 것과 다른가?
우선, 데이터 마이닝 책에서 언밸런스 드 데이터 세트 를 처리하는 방법을 설명하는 데 사용되는 일반적인 레이아웃에 대해 설명하겠습니다 . 일반적으로 주 섹션은 언밸런스 드 데이터 셋 (Unbalanced Datasets)으로 구성되며 비용에 민감한 분류 및 샘플링 기법이라는 두 가지 하위 섹션을 포함합니다. 드문 클래스 에서 문제가 발생 하면 비용에 민감한 분류와 샘플링을 …

8
머신 러닝을위한 "핫 알고리즘"은 무엇입니까?
이것은 기계 학습을 배우기 시작한 누군가의 순진한 질문입니다. 저는 요즘 Marsland의 "Machine Learning : 알고리즘 관점"이라는 책을 읽고 있습니다. 소개 책으로 유용하다고 생각하지만 현재는 최상의 결과를 제공하는 고급 알고리즘으로 가고 싶습니다. 나는 주로 생물 정보학에 관심이있다 : 생물학적 네트워크의 클러스터링과 생물학적 염기 서열에서의 패턴 발견, 특히 단일 염기 다형성 (SNP) …

1
SVM에서 초평면으로부터의 거리 해석
SVM을 직관적으로 이해하는 데는 몇 가지 의심이 있습니다. SVMLight 또는 LibSVM과 같은 일부 표준 도구를 사용하여 분류를 위해 SVM 모델을 학습했다고 가정합니다. 테스트 데이터 예측에이 모델을 사용하면 모델은 각 테스트 포인트에 대해 "알파"값을 가진 파일을 생성합니다. 알파 값이 양수이면 테스트 포인트가 클래스 1에 속하고 그렇지 않으면 클래스 2에 속합니다. 이제 …

1
언제 AdaBoost를 사용하고 싶습니까?
직장에서 반복적으로 언급 된 AdaBoost 분류기에 대해 들었을 때, 작동 방식과 사용시기에 대해 더 나은 느낌을 얻고 싶었습니다. 계속해서 Google에서 찾은 여러 논문과 자습서를 읽었지만 여전히 이해하기 어려운 분류 기준이 있습니다. 내가 본 대부분의 튜토리얼은 AdaBoost에 대해 많은 분류기 중 가장 가중치가 높은 조합을 찾는 것으로 말합니다. 이것은 나에게 의미가 …

2
기계 학습을위한 시계열의 순서
교차 검증 및 시계열에 대한 RJ Hyndman 의 "연구 팁"중 하나를 읽은 후 여기에서 공식화하려고하는 오래된 질문으로 돌아 왔습니다. 분류 또는 회귀 문제에서 데이터의 순서는 중요하지 않으므로 k 배 교차 검증을 사용할 수 있습니다. 반면 시계열에서 데이터 순서는 매우 중요합니다. 그러나 기계 학습 모델을 사용하여 시계열을 예측할 때 일반적인 전략은 …

2
선택한 기능 수가 줄어들면 랜덤 포리스트 OOB 오류 추정치가 개선되는 이유는 무엇입니까?
1000 개의 기능을 가진 두 개의 알려진 그룹으로 분할 된 마이크로 어레이 데이터 세트에서 분류 자로 임의 포리스트 알고리즘을 적용하고 있습니다. 처음 실행 한 후에는 기능의 중요성을 살펴보고 5, 10 및 20 개의 가장 중요한 기능으로 트리 알고리즘을 다시 실행합니다. 모든 기능의 상위 10 및 20에서 오류율의 OOB 추정치는 1.19 …


1
캐럿 glmnet vs cv.glmnet
glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 ​​재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

4
머신 러닝 알고리즘의 예측 구간
아래에 설명 된 프로세스가 유효하고 수용 가능하며 정당화가 가능한지 알고 싶습니다. 아이디어 :지도 학습 알고리즘은 데이터에 대한 기본 구조 / 분포를 가정하지 않습니다. 하루가 끝나면 포인트 견적을 출력합니다. 어떻게 든 추정치의 불확실성을 정량화하기를 희망합니다. 이제 ML 모델 구축 프로세스는 본질적으로 임의적입니다 (예 : 하이퍼 파라미터 튜닝을위한 교차 검증 및 확률 …


1
GAM vs LOESS vs 스플라인
컨텍스트 : 매개 변수로 표시되지 않는 산점도에 선을 그리려면에서를 사용 geom_smooth()하고 ggplot있습니다 R. 자동으로 반환 geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.내가 GAM이 일반화 된 첨가제 모델을 의미 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.