통계 및 빅 데이터 machine-learning

2

기능 수가 증가하면 정확도가 떨어지지 만 pre / recall이 증가합니다.

저는 머신 러닝을 처음 사용합니다. 현재 NLTK와 python을 사용하여 작은 클래스의 텍스트를 양, 음 또는 중립으로 분류하기 위해 Naive Bayes (NB) 분류기를 사용하고 있습니다. 300,000 개의 인스턴스 (16,924 긍정 7,477 네거티브 및 275,599 개의 중립)로 구성된 데이터 세트를 사용하여 일부 테스트를 수행 한 후 피처 수를 늘리면 정확도는 떨어지지 만 …

15 machine-learning classification naive-bayes precision-recall

5

다른 분류 자의 장단점을 비교하는 좋은 자료는 무엇입니까?

가장 뛰어난 2 급 분류기는 무엇입니까? 예, 그것은 백만 달러짜리 질문이라고 생각합니다. 그리고 무료 점심 식사 정리 를 알고 있습니다. 그리고 이전 질문도 읽었습니다. 어플리케이션에 가장 적합한 2 등급 분류기는 무엇입니까? 그리고 최악의 분류 아직도, 나는 그 주제에 대해 더 많은 것을 읽고 싶습니다. 다른 분류기의 특징, 장점 및 특징에 …

15 machine-learning classification references

1

클러스터링 : Jensen-Shannon Divergence 또는 해당 사각형을 사용해야합니까?

Affinity Propagation 알고리즘을 사용하여 확률 분포를 클러스터링 하고 Jensen-Shannon Divergence를 거리 메트릭으로 사용할 계획입니다. JSD 자체를 거리 또는 JSD 제곱으로 사용하는 것이 맞습니까? 왜? 하나를 선택하면 어떤 차이점이 있습니까?

15 machine-learning clustering entropy distance-functions

5

작은 샘플 임상 연구에서 머신 러닝 기술 적용

분류 맥락에서 흥미로운 예측 변수를 분리하는 것이 목표 인 경우 소규모 표본 임상 연구에서 랜덤 포레스트 또는 벌점 형 회귀 (L1 또는 L2 페널티 또는 이들의 조합으로)와 같은 기계 학습 기술을 적용하는 것에 대해 어떻게 생각하십니까? 모델 선택에 대한 질문이 아니며 가변 효과 / 중요도에 대한 최적의 추정치를 찾는 방법에 …

15 machine-learning feature-selection

10

어플리케이션에 가장 적합한 2 등급 분류기는 무엇입니까? [닫은]

폐쇄되었습니다 . 이 질문은 의견 기반 입니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 삼년 전에 . 규칙 : 답변 당 하나의 분류 자 동의하면 투표 중복을 제거 / 제거합니다. 의견에 당신의 응용 프로그램을 넣어

15 machine-learning classification application

4

인공 신경망이란 무엇입니까?

우리가 신경망 문학 을 탐구함에 따라 , 우리는 신경 형태 토폴로지 ( "Neural-Network"-like architectures)로 다른 방법을 식별하게된다. 저는 보편적 근사 정리 에 대해 이야기하고 있지 않습니다 . 아래에 예가 나와 있습니다. 그렇다면 인공 신경망의 정의는 무엇입니까? 그것의 토폴로지는 모든 것을 다루는 것처럼 보입니다. 예 : 우리가 처음으로 식별하는 것 중 …

15 machine-learning neural-networks deep-learning unsupervised-learning supervised-learning

2

신경 네트워크 대 다른 모든 것

Google 에서 이것에 대한 만족스러운 답변을 찾지 못했습니다 . 물론 내가 가진 데이터가 수백만 정도라면 딥 러닝이 길입니다. 그리고 빅 데이터가 없으면 기계 학습에 다른 방법을 사용하는 것이 좋습니다. 주어진 이유는 과적 합입니다. 기계 학습 : 즉 데이터, 특징 추출, 수집 된 것으로부터 새로운 특징 만들기 등 상관 관계가 큰 …

15 regression machine-learning classification neural-networks deep-learning

3

서포트 벡터 머신 및 하이퍼 플레인에 대한 직감

내 프로젝트에서 이진 분류 (1 또는 0)를 예측하기위한 로지스틱 회귀 모델을 만들고 싶습니다. 나는 15 개의 변수를 가지고 있는데 그중 2 개는 범주 형이며 나머지는 연속 형과 이산 형 변수가 혼합되어 있습니다. 로지스틱 회귀 모델에 맞추기 위해 SVM, 퍼셉트론 또는 선형 프로그래밍을 사용하여 선형 분리 성을 확인하는 것이 좋습니다. 제안 …

15 machine-learning logistic classification svm separation

4

의사 결정 트리의 바이어스가 낮고 분산이 높은 이유는 무엇입니까?

질문 나무가 얕거나 깊은 지에 달려 있습니까? 아니면 나무의 깊이 / 수준에 관계없이 이것을 말할 수 있습니까? 왜 바이어스가 낮고 분산이 높습니까? 직관적이고 수학적으로 설명하십시오

15 machine-learning variance covariance cart bias

3

심층 신경망에서 최소 레이어 수

다중 계층 신경망을 심층 신경망으로 분류하거나 다른 방법으로 '심층 신경망에서 최소 레이어 수는 얼마입니까?'

15 machine-learning neural-networks deep-learning terminology

3

선형 분류기의 경우 더 큰 계수가 더 중요한 특징을 의미합니까?

기계 학습을 담당하는 소프트웨어 엔지니어입니다. 내 이해에서 선형 회귀 (예 : OLS) 및 선형 분류 (예 : 로지스틱 회귀 및 SVM)는 훈련 된 계수 와 특징 변수 사이의 내부 곱을 기반으로 예측합니다 .승⃗ 승→\vec{w}엑스⃗ 엑스→\vec{x} 와이^= f( 승⃗ ⋅ x⃗ ) = f( ∑나는승나는엑스나는)와이^=에프(승→⋅엑스→)=에프(∑나는승나는엑스나는) \hat{y} = f(\vec{w} \cdot \vec{x}) = …

15 regression machine-learning classification feature-selection linear-model

2

랜덤 포레스트에 대해보고 할 훈련 오류는 무엇입니까?

현재 randomForestR 의 패키지를 사용하여 분류 문제에 임의의 포리스트를 적용하고 있으며 이러한 모델의 교육 오류 를보고하는 방법에 대해 잘 모르겠습니다 . 명령으로 얻은 예측을 사용하여 계산하면 내 훈련 오류가 0 %에 가깝습니다. predict(model, data=X_train) X_train훈련 데이터는 어디에 있습니까 ? 관련 질문에 대한 답변에서 , 나는 가방 부족 (OOB) 훈련 오류를 …

15 r machine-learning classification random-forest overfitting

5

커널 SVM : 더 높은 차원의 피쳐 공간에 대한 매핑에 대한 직관적 인 이해와 이것이 선형 분리를 가능하게하는 방법을 원합니다.

커널 SVM의 직관을 이해하려고합니다. 이제 선형 SVM의 작동 방식을 이해하고 데이터를 최대한 분할하는 의사 결정 라인을 만듭니다. 또한 데이터를 더 높은 차원의 공간으로 포팅하는 원리와 이것이 새로운 공간에서 선형 의사 결정 라인을 더 쉽게 찾을 수있는 방법을 이해합니다. 내가 이해하지 못하는 것은 커널을 사용하여 데이터 포인트를이 새로운 공간에 투영하는 방법입니다. …

15 machine-learning svm kernel-trick

1

연구에서 검증 정확도는 높지만 테스트 정확도는 낮 으면 어떻게해야합니까?

기계 학습 연구의 유효성 검사에 대한 특정 질문이 있습니다. 아시다시피, 머신 러닝 체제는 연구원들에게 훈련 데이터에 대한 모델을 훈련시키고 검증 세트에 따라 후보 모델 중에서 선택하고 테스트 세트에 대한 정확성을보고하도록 요청합니다. 매우 엄격한 연구에서 테스트 세트는 한 번만 사용할 수 있습니다. 그러나 논문을 출판하거나 제출하기 전에 테스트 정확도가 최신 결과보다 …

15 machine-learning cross-validation reproducible-research

1

CNN이 사라지는 그라디언트 문제를 피하는 방법

나는 convoloutional 신경 네트워크에 대해 많은 것을 읽었으며 그들이 사라지는 기울기 문제를 어떻게 피하는지 궁금해하고있었습니다. 나는 딥 신념 네트워크가 단일 레벨 자동 인코더 또는 다른 사전 훈련 된 얕은 네트워크를 쌓아서이 문제를 피할 수 있다는 것을 알고 있지만 CNN에서 어떻게 피할 수 있는지 모르겠습니다. Wikipedia 에 따르면 : "위에서 언급 …

15 machine-learning optimization deep-learning gradient-descent

«machine-learning» 태그된 질문