«classification» 태그된 질문

통계적 분류는 하위 모집단이 알려진 관측치가 포함 된 훈련 데이터 세트를 기반으로 하위 모집단의 신원을 알 수없는 새로운 관측치가 속하는 하위 모집단을 식별하는 문제입니다. 따라서 이러한 분류는 통계로 조사 할 수있는 가변 동작을 보여줍니다.


2
정확도 = 1- 테스트 오류율
이것이 매우 명백한 질문이라면 사과하지만 다양한 게시물을 읽었으며 좋은 확인을 찾지 못하는 것 같습니다. 분류의 경우 분류기의 정확도 = 1- 테스트 오류율 입니까? 정확도는 이지만 내 질문은 정확도와 테스트 오류율이 정확히 어떻게 관련되어 있는지입니다. 티피+ T엔피+ N티피+티엔피+엔\frac{TP+TN}{P+N}


2
분류 및 회귀 트리 뒤의 수학
누구든지 CART 분류의 일부 수학을 설명 할 수 있습니까? 두 가지 주요 단계가 어떻게 진행되는지 이해하려고합니다. 예를 들어 데이터 세트에 대해 CART 분류기를 훈련시키고 예측 데이터를 표시하기 위해 테스트 데이터 세트를 사용했지만 다음과 같습니다. 나무의 초기 뿌리는 어떻게 선택됩니까? 각 가지가 왜 그리고 어떻게 형성됩니까? 15 개의 열과 23 개의 …

4
정확도 향상이 중요한지 확인
사물을 두 가지 범주로 분류하는 알고리즘이 있다고 가정합니다. 1000 가지 테스트 항목에서 알고리즘의 정확도를 측정 할 수 있습니다. 사물 중 80 %가 올바르게 분류되었다고 가정하십시오. 81 %의 것들이 올바르게 분류되도록 알고리즘을 어떻게 든 수정한다고 가정 해 봅시다. 통계가 알고리즘 개선이 통계적으로 유의한지 여부에 대해 알려줄 수 있습니까? 이 상황에서 통계적 …

4
ROC 곡선을 해석하는 방법?
SAS의 데이터에 로지스틱 회귀를 적용했으며 여기에 ROC 곡선 및 분류 표가 있습니다. 나는 분류 표의 수치에 익숙하지만 roc 곡선과 그 아래 영역이 무엇을 나타내는 지 정확히 알지 못합니다. 모든 설명은 크게 감사하겠습니다.


2
Naive Bayes는 연속 변수와 어떻게 작동합니까?
내 (매우 기본적인) 이해를 위해 Naive Bayes는 훈련 데이터에서 각 기능의 클래스 빈도를 기반으로 확률을 추정합니다. 그러나 연속 변수의 빈도를 어떻게 계산합니까? 그리고 예측을 수행 할 때 훈련 세트에서 동일한 관측치 값을 가질 수없는 새로운 관측치를 어떻게 분류합니까? 거리 측정을 사용하거나 1NN을 찾습니까?


1
ROC 곡선이 서로 교차 할 때 두 모델 비교
둘 이상의 분류 모델을 비교하는 데 사용되는 일반적인 방법 중 하나는 ROC 곡선 (AUC) 아래 면적을 성능을 간접적으로 평가하는 방법으로 사용하는 것입니다. 이 경우 AUC가 큰 모델은 일반적으로 AUC가 작은 모델보다 성능이 우수한 것으로 해석됩니다. 그러나 Vihinen, 2012 ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3303716/ )에 따르면 두 곡선이 서로 교차하면 이러한 비교는 더 이상 …

4
비선형 모델을 사용할 때 다중 공선성에 대해 걱정해야합니까?
대부분 범주 형 기능에 이진 분류 문제가 있다고 가정합니다. 비선형 모델 (예 : XGBoost 또는 Random Forests)을 사용하여 학습합니다. 여전히 다중 공선성에 대해 걱정해야합니까? 왜? 위의 답변이 사실이라면, 이러한 유형의 비선형 모델을 사용하고 있다는 점을 고려하여 어떻게 싸워야합니까?

3
기계 학습 모델 (GBM, NN 등)을 생존 분석에 어떻게 사용할 수 있습니까?
나는 Cox 비례 위험 회귀 및 일부 Kaplan-Meier 모델과 같은 전통적인 통계 모델을 사용하여 다음 사건이 발생할 때까지의 일을 실패 등으로 예측할 수 있습니다. 즉 생존 분석 질문 GBM, 신경망 등과 같은 기계 학습 모델의 회귀 버전을 사용하여 이벤트가 발생할 때까지 일을 어떻게 예측할 수 있습니까? 대상 변수로 발생까지 일을 …

1
딥 네트워크의 LSTM 계층을 훈련시키는 방법
텍스트를 분류하기 위해 lstm 및 피드 포워드 네트워크를 사용하고 있습니다. 텍스트를 one-hot 벡터로 변환하고 각각을 lstm에 공급하여 단일 표현으로 요약 할 수 있습니다. 그런 다음 다른 네트워크에 공급합니다. 그러나 lstm을 어떻게 훈련합니까? 텍스트를 순서대로 분류하고 싶습니다. 훈련없이 텍스트를 제공해야합니까? 나는 구절을 분류기의 입력 레이어에 공급할 수있는 단일 항목으로 표현하고 싶습니다. …

2
캐럿 패키지를 사용하면 특정 임계 값에 대한 혼동 행렬을 얻을 수 있습니까?
train이항 반응에 대한 로지스틱 회귀 모델 (via )을 얻었으며 confusionMatrixin에서 로지스틱 혼동 행렬을 얻었 습니다 caret. 물류 모델 혼동 행렬을 제공하지만 어떤 임계 값을 얻는 데 사용되는지 확실하지 않습니다. confusionMatrix에서를 사용하여 특정 임계 값에 대한 혼동 행렬을 얻으려면 어떻게해야 caret합니까?

2
멀티 클래스 퍼셉트론은 어떻게 작동합니까?
나는 수학에 대한 배경 지식이 없지만 간단한 Perceptron의 작동 방식을 이해하고 하이퍼 평면의 개념을 이해한다고 생각합니다 (나는 3D 공간에서 두 점 구름을 분리하는 선으로 구분되는 것처럼 기하학적으로 상상합니다) 2D 공간에서 두 점 구름). 그러나 나는 하나의 평면이나 하나의 선이 3D 공간 또는 2D 공간에서 각각 3 개의 다른 점 구름을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.