«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

5
신경망을위한 수학적 배경
이것이이 사이트에 적합한 지 확실하지 않지만 컴퓨터 과학 (응용 수학 학사)에서 MSE를 시작하고 기계 학습에 대한 강력한 배경을 얻고 싶습니다 (박사 학위를 추구 할 것입니다). 내 관심사 중 하나는 신경망입니다. ANN에게 좋은 수학적 배경은 무엇입니까? 기계 학습의 다른 영역과 마찬가지로 선형 대수학이 중요하다고 생각하지만 다른 수학 영역은 무엇입니까? 신경망 : …


2
이 모델 접근 방식에 과적 합이 있습니까?
나는 최근에 내가 따르는 과정 (MS 논문의 구성 요소)이 과적 합으로 보일 수 있다고 들었다. 나는 이것을 더 잘 이해하고 다른 사람들이 동의하는지 확인하려고합니다. 이 부분의 목적 은 데이터 세트에서 그라디언트 부스트 회귀 트리의 성능을 랜덤 포레스트와 비교하십시오. 선택한 최종 모델 (GBM 또는 RF)의 성능을 확인하십시오. R 의 gbm및 randomForest패키지가 …

1
가우스 프로세스 및 Wishart 분포에 대한 공분산 행렬
이 글을 통해 GWP ( Generalized Wishart Processes) 에 대해 읽고 있습니다. 이 논문은 제곱 지수 공분산 함수, 즉 사용하여 다른 랜덤 변수 ( 가우시안 프로세스에 따른 ) 간의 공분산을 계산합니다. . 그런 다음이 공분산 행렬은 GWP를 따릅니다.케이( x , x') = exp( − | ( x − x') |22 …

2
분류 문제에서 클래스 분리 성 측정
선형 판별 학습자에서 클래스 분리 성을 측정하는 좋은 예는 Fisher의 선형 판별 비율입니다. 기능 세트가 대상 변수 사이에 클래스를 잘 분리 할 수 ​​있는지 판별하기위한 다른 유용한 지표가 있습니까? 특히, 대상 클래스 분리를 ​​최대화하기위한 우수한 다변량 입력 속성을 찾는 데 관심이 있으며, 비선형 / 비모수 적 측정을 통해 분리 성이 …

3
로지스틱 회귀 분석에서 변수의 중요성
아마도 백 번 전에 해결 된 문제를 다루고 있지만 대답을 어디서 찾을 수 있는지 잘 모르겠습니다. 로지스틱 회귀 분석을 사용할 때 많은 기능 을 고려하고 이진 범주 값 를 예측하려고하면 잘 예측하는 기능의 하위 집합을 선택하는 데 관심이 있습니다. y y엑스1, . . . , x엔x1,...,xnx_1,...,x_n와이yy와이yy 올가미와 유사한 절차를 사용할 …


2
회귀의 목적으로 예측 변수의 차원을 줄이는 이점은 무엇입니까?
기존의 회귀 기법에 비해 차원 축소 회귀 (DRR) 또는 감독 차원 축소 (SDR) 기법 의 적용 또는 장점은 무엇입니까 ( 차원 축소 없이)? 이러한 기술 클래스는 회귀 문제에 대한 특징 세트의 저 차원 표현을 찾습니다. 이러한 기술의 예에는 슬라이스 역 회귀, 주 헤 시안 방향, 슬라이스 평균 분산 추정, 커널 …

2
AI의 초파리는 무엇입니까?
1960 년대 중반 연구자들은 체스를 " AI의 초파리 (Drosophila of AI)" 라고 불렀습니다 . 과일 파리처럼 체스 게임은 접근하기 쉽고 상대적으로 간단한 문제는 실험했지만, 여전히 중요한 지식은 더 복잡한 문제를 만들어 냈습니다. 이제 사람들은 "체스 만 검색 문제"라고 말하고 "체스 방법은 AI 커뮤니티에 더 이상 관심을 갖지 않을 것"이라고 말합니다. …

1
2 클래스 모델을 멀티 클래스 문제로 확장
Adaboost에 대한 이 백서는 2 클래스 모델을 K 클래스 문제로 확장하기위한 몇 가지 제안과 코드 (17 페이지)를 제공합니다. 다른 2 클래스 모델을 쉽게 연결하고 결과를 비교할 수 있도록이 코드를 일반화하고 싶습니다. 대부분의 분류 모델에는 수식 인터페이스와 predict방법이 있으므로이 중 일부는 비교적 쉽습니다. 불행히도 2 클래스 모델에서 클래스 확률을 추출하는 표준 …

4
k- 평균에서 최적의 k가없는 경우가 있습니까?
이것은 적어도 몇 시간 동안 내 마음 속에있었습니다. k- 평균 알고리즘 ( 코사인 유사성 메트릭 사용 ) 의 출력에 대한 최적의 k를 찾으려고 노력 했기 때문에 클러스터 수의 함수로 왜곡을 플로팅했습니다. 내 데이터 세트는 600 차원 공간에 800 개의 문서를 모은 것입니다. 내가 이해 한 바에 따르면,이 곡선에서 무릎 점 …

3
희소 예측 변수 및 반응을 사용하는 CART와 유사한 방법에 사용할 수있는 라이브러리가 있습니까?
R의 gbm 패키지를 사용하여 일부 큰 데이터 세트로 작업하고 있습니다. 예측 변수 행렬과 응답 벡터가 매우 희박합니다 (즉, 대부분의 항목이 0 임). 나는 여기 에서했던 것처럼이 sparseness를 이용하는 알고리즘을 사용하여 의사 결정 트리를 구축하기를 바랐다 . 이 백서에서와 같이 대부분의 항목에는 가능한 많은 기능 중 일부만 있으므로 데이터가 명시 적으로 …

2
숨겨진 마르코프 모델에서 초기 전이 probabilites의 중요성
히든 마르코프 모델에서 전환 확률에 특정 초기 값을 부여하면 어떤 이점이 있습니까? 결국 시스템은 그것들을 배우므로 임의의 값 이외의 값을 제공하는 요점은 무엇입니까? 기본 알고리즘이 Baum-Welch와 같은 차이를 만들어 냅니까? 처음에 과도기 확률을 매우 정확하게 알고 주요 목적이 숨겨진 상태에서 관측치까지의 출력 확률을 예측하는 것이라면 무엇을 조언 하시겠습니까?

2
랜덤 포레스트 모델로부터의 예측을 설명하는 방법이 있습니까?
임의 포리스트 (R의 randomForest 패키지 사용)를 기반으로 예측 분류 모델이 있다고 가정합니다. 최종 사용자가 예측을 생성 할 항목을 지정할 수 있도록 설정하고 분류 가능성을 출력하려고합니다. 지금까지 아무런 문제가 없습니다. 그러나 변수 중요도 그래프와 같은 것을 출력 할 수 있지만 훈련 세트가 아닌 특정 항목에 대해 예측할 수 있으면 유용하고 멋집니다. …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.