«supervised-learning» 태그된 질문

지도 학습은 레이블이 지정된 학습 데이터에서 기능을 유추하는 기계 학습 작업입니다. 교육 데이터는 일련의 교육 예제로 구성됩니다. 지도 학습에서 각 예는 입력 객체 (일반적으로 벡터)와 원하는 출력 값 (감독 신호라고도 함)으로 구성된 쌍입니다. 지도 학습 알고리즘은 학습 데이터를 분석하고 추론 함수를 생성하여 새로운 예제를 매핑하는 데 사용할 수 있습니다.

2
그라디언트 디센트는이 데이터 세트에서 보통 최소 제곱에 대한 솔루션을 찾지 못합니까?
나는 선형 회귀를 연구하고 아래 세트 {(x, y)}에서 시도했습니다. 여기서 x는 평방 피트 단위의 주택 면적을 지정하고 y는 가격을 달러 단위로 지정했습니다. Andrew Ng Notes 의 첫 번째 예입니다 . 2104,400 1600,330 2400,369 1416,232 3000,540 샘플 코드를 개발했지만 실행할 때 각 단계마다 비용이 증가하는 반면 각 단계마다 비용이 감소합니다. 아래에 …

1
자동 키워드 추출 : 코사인 유사성을 기능으로 사용
나는 문서 용어 행렬 을 가지고 있으며 이제 감독 학습 방법 (SVM, Naive Bayes, ...)을 사용하여 각 문서의 키워드를 추출하고 싶습니다. 이 모델에서는 이미 Tf-idf, Pos 태그를 사용합니다 ...미디엄MM 그러나 지금 나는 다음에 대해 궁금합니다. 용어 사이에 코사인 유사성 이있는 행렬 가 있습니다.씨CC 이 유사성을 내 모델의 기능으로 사용할 가능성이 …

1
Fisher의 정확한 테스트 및 초기 하 분포
피셔의 정확한 테스트를 더 잘 이해하고 싶기 때문에 f와 m이 남성과 여성에 해당하고 n과 y가 "소다 소비"에 해당하는 다음 장난감 예제를 고안했습니다. > soda_gender f m n 0 5 y 5 0 분명히 이것은 과감한 단순화이지만 컨텍스트가 방해되는 것을 원하지 않았습니다. 여기서 나는 남자들이 음료수를 마시지 않고 여자들은 음료수를 마시고 …

2
불확실한 데이터로지도 학습?
불확실한 데이터 셋에지도 학습 모델을 적용하기위한 기존의 방법론이 있습니까? 예를 들어 클래스 A와 B가있는 데이터 세트가 있다고 가정 해 봅시다. +----------+----------+-------+-----------+ | FeatureA | FeatureB | Label | Certainty | +----------+----------+-------+-----------+ | 2 | 3 | A | 50% | | 3 | 1 | B | 80% | | …

2
R의 분류 모델에 대한 증분 학습
아래 코드를 사용하여 사기 탐지를위한 분류 자 (결정 트리, 임의 포리스트, 로지스틱 회귀 등과 같은 표준 분류 자 ​​중 하나 일 수 있음) 가 있다고 가정합니다 . library(randomForest) rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier Say, Y is a binary outcome …

2
문자열 패턴 학습을위한 기계 학습 기술
다른 자체 정의 범주에 속하는 단어 목록이 있습니다. 각 범주에는 고유 한 패턴이 있습니다 (예를 들어, 하나는 특수 문자로 고정 길이를 가지며 다른 하나는이 범주에서 "단어"등으로 나타나는 문자가 존재 함). 예를 들면 다음과 같습니다. "ABC" -> type1 "ACC" -> type1 "a8 219" -> type2 "c 827" -> type2 "ASDF 123" …


2
불일치 조치를위한 가중치를 찾는 방법
클러스터링에 사용할 수있는 비 유사성 측정에 대한 속성 가중치를 배우고 싶습니다. 나는 몇 가지 예제가 (동일한 클러스터에 있어야합니다) "와 유사한"뿐만 아니라 몇 가지 예로 들어있는 객체의 쌍 "유사하지"있는 객체의 쌍은 (안을 동일한 클러스터에 있어야 함). 각 객체에는 여러 가지 속성이 있습니다. 원하는 경우 각 객체를 차원 벡터의 피처 로 생각할 …

1
연속 변수에 대한 최적의 이산 화법을 찾고 평가하는 방법
연속 변수와 이진 대상 변수 (0 및 1)가있는 데이터 세트가 있습니다. 목표 변수와 관련하여 연속 변수 (로지스틱 회귀 분석)를 불연속 화하고 각 구간의 관측 빈도가 균형을 이루도록 제한해야합니다. Chi Merge, 의사 결정 트리와 같은 기계 학습 알고리즘을 시도했습니다. Chi merge는 각 구간에서 매우 불균형 한 수의 구간을 제공했습니다 (3 개의 …

3
LDA 대 퍼셉트론
LDA가 다른지도 학습 기술 내에서 어떻게 '적합'하는지 느끼려고 노력하고 있습니다. LDA에 대한 LDA-esque 게시물을 이미 읽었습니다. 나는 이미 퍼셉트론에 익숙하지만 지금은 LDA를 배우고 있습니다. LDA는지도 학습 알고리즘 제품군에 어떻게 적합합니까? 다른 방법에 비해 단점은 무엇이며 더 잘 사용할 수있는 방법은 무엇입니까? 예를 들어 퍼셉트론을 사용할 수있을 때 왜 LDA를 사용합니까?
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.