«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
기능 수가 증가하면 정확도가 떨어지지 만 pre / recall이 증가합니다.
저는 머신 러닝을 처음 사용합니다. 현재 NLTK와 python을 사용하여 작은 클래스의 텍스트를 양, 음 또는 중립으로 분류하기 위해 Naive Bayes (NB) 분류기를 사용하고 있습니다. 300,000 개의 인스턴스 (16,924 긍정 7,477 네거티브 및 275,599 개의 중립)로 구성된 데이터 세트를 사용하여 일부 테스트를 수행 한 후 피처 수를 늘리면 정확도는 떨어지지 만 …

5
다른 분류 자의 장단점을 비교하는 좋은 자료는 무엇입니까?
가장 뛰어난 2 급 분류기는 무엇입니까? 예, 그것은 백만 달러짜리 질문이라고 생각합니다. 그리고 무료 점심 식사 정리 를 알고 있습니다. 그리고 이전 질문도 읽었습니다. 어플리케이션에 가장 적합한 2 등급 분류기는 무엇입니까? 그리고 최악의 분류 아직도, 나는 그 주제에 대해 더 많은 것을 읽고 싶습니다. 다른 분류기의 특징, 장점 및 특징에 …


5
작은 샘플 임상 연구에서 머신 러닝 기술 적용
분류 맥락에서 흥미로운 예측 변수를 분리하는 것이 목표 인 경우 소규모 표본 임상 연구에서 랜덤 포레스트 또는 벌점 형 회귀 (L1 또는 L2 페널티 또는 이들의 조합으로)와 같은 기계 학습 기술을 적용하는 것에 대해 어떻게 생각하십니까? 모델 선택에 대한 질문이 아니며 가변 효과 / 중요도에 대한 최적의 추정치를 찾는 방법에 …

10
어플리케이션에 가장 적합한 2 등급 분류기는 무엇입니까? [닫은]
폐쇄되었습니다 . 이 질문은 의견 기반 입니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 삼년 전에 . 규칙 : 답변 당 하나의 분류 자 동의하면 투표 중복을 제거 / 제거합니다. 의견에 당신의 응용 프로그램을 넣어

4
인공 신경망이란 무엇입니까?
우리가 신경망 문학 을 탐구함에 따라 , 우리는 신경 형태 토폴로지 ( "Neural-Network"-like architectures)로 다른 방법을 식별하게된다. 저는 보편적 근사 정리 에 대해 이야기하고 있지 않습니다 . 아래에 예가 나와 있습니다. 그렇다면 인공 신경망의 정의는 무엇입니까? 그것의 토폴로지는 모든 것을 다루는 것처럼 보입니다. 예 : 우리가 처음으로 식별하는 것 중 …

2
신경 네트워크 대 다른 모든 것
Google 에서 이것에 대한 만족스러운 답변을 찾지 못했습니다 . 물론 내가 가진 데이터가 수백만 정도라면 딥 러닝이 길입니다. 그리고 빅 데이터가 없으면 기계 학습에 다른 방법을 사용하는 것이 좋습니다. 주어진 이유는 과적 합입니다. 기계 학습 : 즉 데이터, 특징 추출, 수집 된 것으로부터 새로운 특징 만들기 등 상관 관계가 큰 …

3
서포트 벡터 머신 및 하이퍼 플레인에 대한 직감
내 프로젝트에서 이진 분류 (1 또는 0)를 예측하기위한 로지스틱 회귀 모델을 만들고 싶습니다. 나는 15 개의 변수를 가지고 있는데 그중 2 개는 범주 형이며 나머지는 연속 형과 이산 형 변수가 혼합되어 있습니다. 로지스틱 회귀 모델에 맞추기 위해 SVM, 퍼셉트론 또는 선형 프로그래밍을 사용하여 선형 분리 성을 확인하는 것이 좋습니다. 제안 …



3
선형 분류기의 경우 더 큰 계수가 더 중요한 특징을 의미합니까?
기계 학습을 담당하는 소프트웨어 엔지니어입니다. 내 이해에서 선형 회귀 (예 : OLS) 및 선형 분류 (예 : 로지스틱 회귀 및 SVM)는 훈련 된 계수 와 특징 변수 사이의 내부 곱을 기반으로 예측합니다 .승⃗ 승→\vec{w}엑스⃗ 엑스→\vec{x} 와이^= f( 승⃗ ⋅ x⃗ ) = f( ∑나는승나는엑스나는)와이^=에프(승→⋅엑스→)=에프(∑나는승나는엑스나는) \hat{y} = f(\vec{w} \cdot \vec{x}) = …

2
랜덤 포레스트에 대해보고 할 훈련 오류는 무엇입니까?
현재 randomForestR 의 패키지를 사용하여 분류 문제에 임의의 포리스트를 적용하고 있으며 이러한 모델의 교육 오류 를보고하는 방법에 대해 잘 모르겠습니다 . 명령으로 얻은 예측을 사용하여 계산하면 내 훈련 오류가 0 %에 가깝습니다. predict(model, data=X_train) X_train훈련 데이터는 어디에 있습니까 ? 관련 질문에 대한 답변에서 , 나는 가방 부족 (OOB) 훈련 오류를 …

5
커널 SVM : 더 높은 차원의 피쳐 공간에 대한 매핑에 대한 직관적 인 이해와 이것이 선형 분리를 가능하게하는 방법을 원합니다.
커널 SVM의 직관을 이해하려고합니다. 이제 선형 SVM의 작동 방식을 이해하고 데이터를 최대한 분할하는 의사 결정 라인을 만듭니다. 또한 데이터를 더 높은 차원의 공간으로 포팅하는 원리와 이것이 새로운 공간에서 선형 의사 결정 라인을 더 쉽게 찾을 수있는 방법을 이해합니다. 내가 이해하지 못하는 것은 커널을 사용하여 데이터 포인트를이 새로운 공간에 투영하는 방법입니다. …

1
연구에서 검증 정확도는 높지만 테스트 정확도는 낮 으면 어떻게해야합니까?
기계 학습 연구의 유효성 검사에 대한 특정 질문이 있습니다. 아시다시피, 머신 러닝 체제는 연구원들에게 훈련 데이터에 대한 모델을 훈련시키고 검증 세트에 따라 후보 모델 중에서 선택하고 테스트 세트에 대한 정확성을보고하도록 요청합니다. 매우 엄격한 연구에서 테스트 세트는 한 번만 사용할 수 있습니다. 그러나 논문을 출판하거나 제출하기 전에 테스트 정확도가 최신 결과보다 …

1
CNN이 사라지는 그라디언트 문제를 피하는 방법
나는 convoloutional 신경 네트워크에 대해 많은 것을 읽었으며 그들이 사라지는 기울기 문제를 어떻게 피하는지 궁금해하고있었습니다. 나는 딥 신념 네트워크가 단일 레벨 자동 인코더 또는 다른 사전 훈련 된 얕은 네트워크를 쌓아서이 문제를 피할 수 있다는 것을 알고 있지만 CNN에서 어떻게 피할 수 있는지 모르겠습니다. Wikipedia 에 따르면 : "위에서 언급 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.