혼동 행렬 을 사용하여 분류기의 성능을 확인하고 있습니다. 나는 Scikit-Learn을 사용하고 있습니다. 결과를 어떻게 해석 할 수 있습니까? from sklearn.metrics import confusion_matrix >>> y_true = [2, 0, 2, 2, 0, 1] >>> y_pred = [0, 0, 2, 2, 0, 2] >>> confusion_matrix(y_true, y_pred) array([[2, 0, 0], [0, 0, 1], [1, …
다음 인용문은 Storey & Tibshirani (2003) 의 유명한 유전체 연구 통계의 유의성에서 발췌 한 것입니다. 예를 들어, 오 탐지율 5 %는 연구에서 실제로 null 인 피처의 평균 5 %가 중요하다고 할 수 있음을 의미합니다. FDR (False Discovery rate)이 5 %라는 것은 중요하다고하는 모든 기능 중에서 5 %가 실제로 평균이 없음을 …
train이항 반응에 대한 로지스틱 회귀 모델 (via )을 얻었으며 confusionMatrixin에서 로지스틱 혼동 행렬을 얻었 습니다 caret. 물류 모델 혼동 행렬을 제공하지만 어떤 임계 값을 얻는 데 사용되는지 확실하지 않습니다. confusionMatrix에서를 사용하여 특정 임계 값에 대한 혼동 행렬을 얻으려면 어떻게해야 caret합니까?
phi와 Matthews 상관 계수는 동일한 개념입니까? 두 이진 변수에 대한 Pearson 상관 계수와 어떻게 관련이 있습니까? 이진 값이 0과 1이라고 가정합니다. 두 Bernoulli 랜덤 변수 와 간의 Pearson 상관 관계 는 다음 과 같습니다.y엑스xx와이yy ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]−−−−−−−−−−√=E[xy]−E[x]E[y]Var[x]Var[y]−−−−−−−−−−√=n11n−n1∙n∙1n0∙n1∙n∙0n∙1−−−−−−−−−−√ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]=E[xy]−E[x]E[y]Var[x]Var[y]=n11n−n1∙n∙1n0∙n1∙n∙0n∙1 \rho = \frac{\mathbb{E} [(x - \mathbb{E}[x])(y - \mathbb{E}[y])]} {\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{\mathbb{E} [xy] - …
6 개의 수업에 문제가 있습니다. 그래서 다음과 같이 멀티 클래스 분류기를 작성합니다. 각 클래스마다 One vs. All을 사용하여 하나의 Logistic Regression 분류 기가 있습니다. 즉, 6 개의 다른 분류자가 있습니다. 분류기 각각에 대해 혼동 매트릭스를보고 할 수 있습니다. 그러나 여기 많은 예에서 보았 듯이 모든 분류 자에 대한 혼동 행렬을보고하고 …