«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.


17
기계 학습 요리 책 / 참조 카드 / 치트 시트?
확률 및 통계 요리 책 및 데이터 마이닝을위한 R 참조 카드 와 같은 리소스는 매우 유용합니다. 그것들은 분명히 참고 자료로 잘 사용되지만 주제에 대한 내 생각을 정리하고 땅을 구하는 데 도움이됩니다. Q : 머신 러닝 방법에 이러한 리소스가 있습니까? 각 ML 방법에 대해 다음을 포함하는 참조 카드를 상상하고 있습니다. 일반 …



5
시계열 예측에 딥 러닝 사용
나는 딥 러닝 분야에서 새로운 것이었고 첫 번째 단계는 deeplearning.net 사이트에서 흥미로운 기사를 읽는 것이 었습니다. 딥 러닝에 관한 논문에서 Hinton과 다른 사람들은 대부분 이미지 문제에 적용하는 것에 대해 이야기합니다. 누군가 내게 대답하려고 할 때 시계열 값 (재무, 인터넷 트래픽 등)을 예측하는 문제에 적용 할 수 있습니까? 가능한 경우 집중해야 …

10
홀드 아웃 유효성 검사 및 교차 유효성 검사
나에게 홀드 아웃 유효성 검사는 쓸모없는 것 같습니다. 즉, 원래 데이터 세트를 두 부분으로 나누고 (훈련 및 테스트) 테스트 점수를 일반화 척도로 사용하는 것은 다소 쓸모가 없습니다. K- 폴드 교차 검증은 일반화에 대해 더 나은 근사치를 제공하는 것으로 보입니다 (모든 지점에서 학습하고 테스트하므로). 그렇다면 표준 보류 검증을 사용하는 이유는 무엇입니까? …

5
통계 학습에서 iid 가정의 중요성
통계적 학습, 내재적으로 또는 명시 적으로, 하나는 반드시 학습 집합에 있다고 가정 으로 구성되는 N 입력 / 응답 튜플 ( X I , Y I ) 되어 독립적 같은 조인트 분포로부터 인출 P ( X를 , Y ) 과D={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( …

10
파이썬을 이용한 머신 러닝
기계 학습 실험을 위해 Python 라이브러리 사용을 고려하고 있습니다. 지금까지 WEKA에 의존하고 있었지만 전반적으로 불만족 스러웠습니다. WEKA가 제대로 지원되지 않는 것으로 나타났습니다 (예를 들어, 문서가 드물고 커뮤니티 지원이 내 경험에서 바람직하지 않습니다). 내가이 움직임을 생각하고있는 또 다른 이유는 내가 정말로 파이썬을 좋아하고 (파이썬에 익숙하지 않다) Java에서 코딩으로 돌아가고 싶지 않기 …

3
모델 검증 전 또는 모델 검증 내에서 기능 정규화를 수행합니까?
머신 러닝의 일반적인 모범 사례는 예측 변수의 특징 정규화 또는 데이터 표준화를 수행하는 것입니다. 즉, 평균을 빼고 데이터를 중심에두고 분산 (또는 표준 편차도)으로 나누어 정규화하는 것입니다. 자립과 이해를 위해 두 가지 주요 목표를 달성하기 위해이 작업을 수행합니다. 수치 적 안정성을 위해 작은 모델 중량을 피하십시오. 컨쥬 게이트 그라디언트 (Conjugate Gradient)와 …

5
신경 네트워크 대 지원 벡터 머신 : 두 번째는 확실히 우수합니까?
필자가 읽은 많은 저자들은 SVM이 회귀 / 분류 문제에 직면 할 수있는 우수한 기술이며, NN을 통해 유사한 결과를 얻을 수 없다는 것을 알고 있습니다. 종종 비교는 NN 대신 SVM 강력한 창립 이론을 가지고 2 차 프로그래밍으로 글로벌 최적 달성 적절한 수의 매개 변수를 선택하는 데 문제가 없습니다 과적 합의 경향이 …

6
강하게 불균형이있는 이진 분류
(기능, 이진 출력 0 또는 1) 형식의 데이터 세트가 있지만 1은 거의 발생하지 않으므로 항상 0을 예측하면 70 %에서 90 % 사이의 정확도를 얻습니다 (내가 보는 특정 데이터에 따라 다름) ). ML 방법은 동일한 정확도를 제공하며,이 상황에서 적용 할 표준 방법이 있어야 분명한 예측 규칙보다 정확도를 향상시킬 수 있다고 생각합니다.


5
기계 학습에서 불균형 데이터가 실제로 문제가되는시기는 언제입니까?
로지스틱 회귀 , SVM , 의사 결정 트리 , 배깅 및 기타 여러 가지 유사한 질문을 사용할 때 불균형 데이터에 대한 여러 가지 질문이 이미있었습니다 . 불행히도, 각 질문은 알고리즘에 특정한 것으로 보이며 불균형 데이터를 다루는 일반적인 지침을 찾지 못했습니다. Marc Claesen의 답변 중 하나를 인용 하여 불균형 데이터 처리 …


5
랜덤 포레스트는 부스팅 알고리즘입니까?
부스팅의 짧은 정의 : 약한 학습자 세트가 하나의 강력한 학습자를 만들 수 있습니까? 약한 학습자는 실제 분류와 약간만 관련이있는 분류 자로 정의됩니다 (임의 추측보다 예제를 더 잘 레이블링 할 수 있음). 랜덤 포레스트 의 짧은 정의 : 랜덤 포레스트는 많은 분류 트리를 자랍니다. 입력 벡터에서 새 개체를 분류하려면 입력 벡터를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.