«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

5
기차, 검증 및 테스트 비율을 어떻게 결정합니까?
레이블이 지정된 데이터를 교육, 검증 및 테스트 세트로 분리 할 때 50/25/25에서 85/5/10까지 모든 것을 들었습니다. 나는 이것이 모델을 어떻게 사용할 것인지와 학습 알고리즘을 과도하게 맞추는 경향에 달려 있다고 확신합니다. 일반적으로 결정하는 방법이 있습니까? ELSII조차도 주제에 대해 모호한 것처럼 보입니다.

1
기계 학습에 대한 통계, 논문 시작?
나는 컴퓨터 프로그래밍과 초등 수 이론에 대한 배경 지식을 가지고 있지만 실제 통계 교육은 없으며 최근에는 모든 기술의 놀라운 세계가 실제로 통계 세계라는 것을 "발견"했습니다. 행렬 인수 분해, 행렬 완성, 고차원 텐서, 임베딩, 밀도 추정, 베이지안 추론, Markov 파티션, 고유 벡터 계산, PageRank는 모두 매우 통계적인 기술이며, 이러한 것을 사용하는 …

1
P (X)의 비 -iid 샘플 및 P (Y | X)의 iid 샘플로부터 확률 구배 하강을 통해 P (Y | X) 모델을 학습 할 수 있습니까?
일부 데이터 세트에서 확률 적 그라디언트 디센트 (stochastic gradient descent)를 통해 파라미터 화 된 모델을 훈련 할 때 (예를 들어 가능성을 최대화하기 위해), 훈련 샘플은 훈련 데이터 분포로부터 iid로 추출되는 것으로 일반적으로 가정된다. 따라서 공동 분포 를 모델링하는 것이 목표 라면 각 분포에서 각 학습 표본 을 추출해야합니다.( x i …

3
최소한의 메모리를 사용하여 데이터를 훈련하는 가장 효율적인 방법은 무엇입니까?
이것은 내 훈련 데이터입니다 : 200,000 예제 x 10,000 기능. 내 훈련 데이터 매트릭스는-200,000 x 10,000입니다. 각 예제의 기능을 생성 할 때마다 모든 데이터 세트를 하나씩 저장하여 메모리 문제없이 플랫 파일로 저장했습니다. 그러나 이제 Milk , SVM light 또는 기타 기계 학습 알고리즘을 사용하면 모든 것이 학습 데이터 대신 하나씩 …

2
정규화
정규화를 수행하는 방법에는 , L 1 및 L 2 규범 기반 정규화 와 같은 많은 방법이 있습니다 . Friedman Hastie & Tibsharani 에 따르면 , 최고의 정규화 기는 문제, 즉 실제 목표 함수의 특성, 사용 된 특정 기준, 신호 대 잡음비 및 샘플 크기에 따라 달라집니다.엘0엘0L_0엘1엘1L_1엘2엘2L_2 다양한 정규화 방법의 방법과 …

3
통계적 유의성을 사용하여 서로 다른 두 모델의 정확도를 비교하는 방법
시계열 예측 작업을하고 있습니다. 두 개의 데이터 세트 및 있습니다. 세 가지 예측 모델이 있습니다. 이러한 모델은 모두 데이터 세트 의 샘플을 사용하여 학습되며 성능은 데이터 세트 의 샘플을 사용하여 측정됩니다 . 성능 지표가 MSE (또는 다른 것)라고 가정 해 봅시다. 데이터 세트 대해 측정 할 때 해당 모델의 MSE …

3
bigram (N-gram) 모델을 사용하여 텍스트 문서의 피처 벡터 작성
텍스트 마이닝을위한 기능 구성에 대한 전통적인 접근 방식은 단어 별 접근 방식이며, tf-idf를 사용하여 주어진 텍스트 문서를 특성화하는 기능 벡터를 설정하여 향상시킬 수 있습니다. 현재 피처 벡터를 구축하기 위해 Bi-gram 언어 모델 또는 (N-gram)을 사용하려고하는데 어떻게 해야할지 모르겠습니다. 단어 대신 백 그램 단위로 빈도 수를 계산하고 tf-idf 가중치 구성표를 사용하여 …

1
매우 큰 시계열 데이터 세트 다루기
매우 큰 데이터 세트에 액세스 할 수 있습니다. 데이터는 4 가지 장르 중 하나에서 음악 발췌를 듣는 사람들의 MEG 기록에서 가져온 것입니다. 데이터는 다음과 같습니다. 6 과목 3 실험 반복 (에포크) 에포크 당 120 개의 평가판 275 MEG 채널의 500Hz (= 4000 개 샘플)에서 시행 당 8 초의 데이터 여기의 …

1
피셔 커널 너머
한동안 피셔 커널은 확률 모델에서 커널을 구성하는 방법 인 것처럼 보였기 때문에 인기가있는 것처럼 보였습니다. 그러나 나는 그들이 실제로 사용되는 것을 거의 보지 못했고, 그들이 잘 작동하지 않는 좋은 권위를 가지고 있습니다. 그들은 Wikipedia를 인용 하여 Fisher 정보 의 계산에 의존합니다 . 피셔 정보는 f의 자연 로그의 θ에 대한 2 …

3
거대한 데이터 세트에서 학습 할 때 접근하는 방법
기본적으로 거대한 데이터 세트에 대해 배우는 두 가지 일반적인 방법이 있습니다 (시간 / 공간 제한이있는 경우). 부정 행위 :)-훈련을 ​​위해 "관리 가능한"하위 집합 만 사용하십시오. 수익 감소 법칙으로 인해 정확도 손실을 무시할 수 있습니다. 모델의 예측 성능은 모든 교육 데이터가 통합되기 훨씬 전에 평평 해집니다. 병렬 컴퓨팅-문제를 더 작은 부분으로 …

1
MFCC가 검색 시스템에 음악을 나타내는 최적의 방법입니까?
신호 처리 기술인 Mel frequency Cepstrum 은 종종 기계 학습 작업에 사용하기 위해 음악 작품에서 정보를 추출하는 데 사용됩니다. 이 방법은 단기 전력 스펙트럼을 제공하며 계수는 입력으로 사용됩니다. 음악 검색 시스템을 설계 할 때, 이러한 계수는 작품의 특성으로 간주됩니다 (분명히 독특하지는 않지만 구별). 네트워크 학습에 더 적합한 특성이 있습니까? Elman …

8
과거 구매 데이터에서 주어진 소모품 사용량을 예측하는 데 어떤 알고리즘을 사용할 수 있습니까?
아마도 간단하지만 흥미로운 문제에 대해 생각하면서, 나는 이전 구매의 전체 역사를 고려할 때 가까운 미래에 필요할 소모품을 예측하는 코드를 작성하고 싶습니다. 나는 이런 종류의 문제가 좀 더 일반적이고 잘 연구 된 정의를 가지고 있다고 확신합니다 (누군가 이것이 ERP 시스템 등의 일부 개념과 관련이 있다고 제안했습니다). 내가 보유한 데이터는 이전 구매 …

6
두 개의 다른 랜덤 포레스트 모델의 R- 제곱 비교
R의 randomForest 패키지를 사용하여 샘플보다 더 많은 예측 변수를 사용하여 "와이드"데이터 세트에서 지속적인 결과를 설명하기 위해 랜덤 포레스트 모델을 개발하고 있습니다. 특히, 하나의 RF 모델을 사용하여 절차에서 중요하다고 생각하는 ~ 75 개의 예측 변수를 선택할 수 있습니다. 이전에 여기에 게시 된 접근 방식을 사용하여 해당 모델이 예약 된 테스트 세트의 …

2
AUC를 사용하는 이유는 무엇입니까?
특히 머신 러닝 문헌의 컴퓨터 과학 지향 측면에서 AUC (수신자 운영자 특성 곡선 아래 영역)는 분류기를 평가하는 데 널리 사용되는 기준입니다. AUC 사용에 대한 정당성은 무엇입니까? 예를 들어 최적의 결정이 최고의 AUC를 가진 분류자인 특정 손실 함수가 있습니까?

1
모형 우도가 null보다 유의하게 높지 않은 경우 (GAM) 회귀 계수의 의의
R 패키지 gamlss를 사용 하고 데이터가 0으로 증가하는 베타 분포를 가정 하고 GAM 기반 회귀 분석을 실행 중 입니다. 내 모델에는 단일 설명 변수 만 있으므로 기본적으로 다음과 같습니다 mymodel = gamlss(response ~ input, family=BEZI). 알고리즘은 설명 변수가 평균 ( )에 미치는 영향 대한 계수 와 대한 관련 p- 값을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.