«classification» 태그된 질문

통계적 분류는 하위 모집단이 알려진 관측치가 포함 된 훈련 데이터 세트를 기반으로 하위 모집단의 신원을 알 수없는 새로운 관측치가 속하는 하위 모집단을 식별하는 문제입니다. 따라서 이러한 분류는 통계로 조사 할 수있는 가변 동작을 보여줍니다.

3
분류에서 다른 손실 함수를 선택하면 약 0-1 손실에 미치는 영향은 무엇입니까?
우리는 일부 객관적인 기능이 최적화하기 쉽고 일부는 어렵다는 것을 알고 있습니다. 그리고 우리가 사용하고자하지만 사용하기 어려운 많은 손실 함수가 있습니다 (예 : 0-1 손실). 그래서 우리 는 작업을 수행하기 위해 프록시 손실 기능을 찾습니다 . 예를 들어 힌지 손실 또는 로지스틱 손실을 사용하여 0-1 손실을 "대략적인"수준으로 만듭니다. 다음은 Chris Bishop의 …

5
PCA가 분류기의 결과를 악화시키는 원인은 무엇입니까?
교차 유효성 검사를 수행하는 분류 기가 있으며, 기능의 최적 조합을 찾기 위해 앞으로 선택하는 백여 가지 기능이 있습니다. 또한 PCA로 동일한 실험을 실행하는 것과 비교할 수 있는데, 여기서 잠재적 인 특징을 취하고 SVD를 적용하며 원래 신호를 새로운 좌표 공간으로 변환하고 앞으로 선택 프로세스에서 상위 기능을 사용합니다 .kkk 신호는 원래의 기능보다 …

1
교차 유효성 검사가 유효성 검사 세트를 대신 할 수 있습니까?
텍스트 분류에는 약 800 샘플로 훈련 세트와 약 150 샘플로 시험 세트가 있습니다. 테스트 세트는 사용 된 적이 없으며 끝날 때까지 사용 대기 중입니다. 분류기 및 기능을 조정하고 조정하는 동안 10 배 교차 검증과 함께 800 샘플 교육 세트를 사용하고 있습니다. 이것은 별도의 유효성 검사 세트가 없지만 각각 10 배가 …

4
CART를 사용할 때 '가변 중요성'을 측정 / 순위 지정하는 방법은 무엇입니까? (특히 R의 {rpart}를 사용하여)
rpart (R)를 사용하여 CART 모델 (특히 분류 트리)을 작성할 때 모델에 도입 된 다양한 변수의 중요성을 아는 것이 종종 흥미 롭습니다. 따라서 제 질문은 CART 모델에 참여하는 변수의 변수 중요도를 평가 / 측정하기 위해 어떤 일반적인 측정이 있습니까? R을 사용하여 어떻게 계산할 수 있습니까 (예 : rpart 패키지를 사용하는 경우) …

7
Naive Bayes에서 테스트 세트에 알 수없는 단어가있을 때 Laplace 스무딩을 방해하는 이유는 무엇입니까?
나는 오늘 Naive Bayes Classification을 읽고있었습니다. 매개 변수 추정 이라는 제목 아래 에 1 스무딩을 추가했습니다 . 하자 ccc (같은 양 또는 음 등) 클래스를 참조하고,하자 www 토큰 또는 단어를 참조하십시오. P(w|c)P(w|c)P(w|c) 의 최대 우도 추정값 은 c o u n t ( w , c )c o u n …

2
부적절한 점수 규칙을 사용하는 것이 언제 적절한가요?
Merkle & Steyvers (2013) 글 : 적절한 채점 규칙을 공식적으로 정의하려면 를 진정한 성공 확률 가진 Bernoulli 시행 의 확률 적 예측 이라고합시다 . 적절한 점수 규칙은 경우 예상 값이 최소화되는 지표입니다 .에프에프f디디d피피p에프= p에프=피f = p 나는 우리가 예측 인들이 그들의 진실한 믿음을 정직하게 반영하는 예측을 생성하도록 장려하고, 그렇지 않으면 …

1
svm에서 일대일 및 일대일?
일대일 및 일대일 SVM 분류기의 차이점은 무엇입니까? one-vs-all은 새로운 이미지의 모든 유형 / 범주를 분류하는 하나의 분류자를 의미하고 one-vs-one은 다른 분류 자로 분류되는 새로운 이미지의 각 유형 / 범주를 의미합니까 (각 범주는 특수 분류 자에 의해 처리됨)? 예를 들어, 새 이미지가 원, 사각형, 삼각형 등으로 분류되는 경우

2
판별 분석의 세 가지 버전 : 차이점 및 사용 방법
아무도 차이점을 설명하고 이러한 세 가지 분석을 사용하는 방법에 대한 구체적인 예를 제시 할 수 있습니까? LDA-선형 판별 분석 FDA-피셔의 판별 분석 QDA-2 차 판별 분석 나는 모든 곳을 검색했지만 이러한 분석을 사용하고 데이터를 계산하는 방법을 볼 수있는 실제 값을 가진 실제 예제를 찾을 수 없었습니다. 실제 예제없이 이해하기 어려운 …

2
신경망 : 이진 분류의 경우 1 개 또는 2 개의 출력 뉴런을 사용합니까?
이진 분류를 수행하고 싶다고 가정합니다 (뭔가 클래스 A 또는 클래스 B에 속함). 신경망의 출력 레이어에서이를 수행 할 수있는 몇 가지 가능성이 있습니다. 1 개의 출력 노드를 사용하십시오. 출력 0 (<0.5)은 클래스 A로 간주되고 1 (> = 0.5)은 클래스 B로 간주됩니다 (시그 모이 드의 경우). 2 개의 출력 노드를 사용하십시오. 입력은 …

4
연속 및 범주 기능을 모두 사용하여 예측
일부 예측 모델링 기법은 연속 예측 변수를 처리하기 위해 더 설계된 반면, 다른 예측 기법은 범주 형 또는 이산 변수를 처리하는 데 더 좋습니다. 물론 한 유형을 다른 유형으로 변환하는 기술이 있습니다 (분산, 더미 변수 등). 그러나 단순히 피처 유형을 변환하지 않고 두 유형의 입력을 동시에 처리하도록 설계된 예측 모델링 …

1
분류와 회귀를 결합한 알고리즘이 있습니까?
분류와 회귀를 동시에 수행 할 수있는 알고리즘이 있는지 궁금합니다. 예를 들어 알고리즘이 분류자를 배우게하고 각 레이블 내 에서 동시에 연속적인 목표를 배우도록하겠습니다. 따라서 각 학습 예에 대해 범주 레이블 과 연속 값이 있습니다. 먼저 분류자를 훈련시킨 다음 각 레이블 내에서 회귀자를 훈련시킬 수 있지만 두 가지를 모두 수행 할 수있는 …

5
주요 주성분은 어떻게 종속 변수에 대한 예측력을 유지할 수 있습니까 (또는 더 나은 예측으로 이어질 수 있습니까)?
회귀 실행한다고 가정하십시오 . 성분을 선택하여 왜 모델이 에 대한 예측력을 유지 합니까?k X YY∼XY∼XY \sim XkkkXXXYYY 차원 축소 / 기능 선택 관점에서 가 상위 고유 값을 가진 의 공분산 행렬의 고유 벡터 이면 는 상위 주요 구성 요소입니다 최대 분산으로. 따라서 우리는 의 피처 수를 줄이고 예측력의 대부분을 이해할 …


2
PCA와 LDA를 결합하는 것이 합리적입니까?
예를 들어 Bayes 분류기를 통해 감독 된 통계 분류 작업에 대한 데이터 집합이 있다고 가정합니다. 이 데이터 세트는 20 개의 피쳐로 구성되며 PCA (Principal Component Analysis) 및 / 또는 LDA (Linear Discriminant Analysis)와 같은 차원 축소 기법을 통해 2 가지 피쳐로 요약하려고합니다. 두 기술 모두 데이터를 더 작은 피쳐 하위 …

3
가장 먼저 분류 할 상위 5 개 분류기
명백한 분류기 특성 외에도 계산 비용, 기능 / 라벨의 예상 데이터 유형 데이터 세트의 특정 크기 및 차원에 대한 적합성 아직 잘 모르는 새로운 데이터 세트에 대해 먼저 시도해야하는 상위 5 개 (또는 10, 20?) 분류기는 무엇입니까 (예 : 의미 및 개별 기능의 상관 관계)? 일반적으로 Naive Bayes, Nearest Neighbor, …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.