«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

1
사람들이 MLP와 함께 더 깊은 RBF 또는 RBF를 사용하지 않는 이유는 무엇입니까?
따라서 Radial Basis Function Neural Networks를 볼 때 사람들은 1 숨겨진 레이어의 사용을 권장하는 반면 멀티 레이어 퍼셉트론 신경 네트워크에서는 더 많은 레이어가 더 나은 것으로 간주됩니다. RBF 네트워크가 역 전파 버전으로 훈련 될 수 있다고 가정하면 더 깊은 RBF 네트워크가 작동하지 않거나 RBF 레이어를 깊은 MLP 네트워크에서 두 번째 …

2
왜 단어 대신 텍스트 언어 식별에 n-gram이 사용됩니까?
널리 사용되는 두 가지 언어 식별 라이브러리 인 C ++ 용 Compact Language Detector 2와 Java 용 언어 탐지기 에서 둘 다 (문자 기반) n-gram을 사용하여 텍스트 기능을 추출했습니다. 단어 백 (한 단어 / 사전)이 사용되지 않는 이유는 무엇입니까? 단어 백과 n- 그램의 장점과 단점은 무엇입니까? 또한 텍스트 분류에서 n-grams …

2
Fisher 기준 가중치를 계산하는 방법은 무엇입니까?
패턴 인식과 기계 학습을 공부하고 있는데 다음 질문에 부딪 쳤습니다. 동일한 사전 등급 확률 클래스 분류 문제를 고려하십시오.P(D1)=P(D2)=12P(D1)=P(D2)=12P(D_1)=P(D_2)= \frac{1}{2} 그리고 각 클래스에서 인스턴스의 분포는 p(x|D1)=N([00],[2001]),p(x|D1)=N([00],[2001]), p(x|D_1)= {\cal N} \left( \begin{bmatrix} 0 \\0 \end{bmatrix}, \begin{bmatrix} 2 & 0 \\ 0 & 1 \end{bmatrix} \right), p(x|D2)=N([44],[1001]).p(x|D2)=N([44],[1001]). p(x|D_2)= {\cal N} \left( \begin{bmatrix} 4 …

3
부스팅 방법이 특이 치에 민감한 이유
부스팅 방법이 특이 치에 민감하다는 내용의 많은 기사를 찾았지만 그 이유를 설명하는 기사는 없습니다. 내 경험상 특이 치는 기계 학습 알고리즘에 좋지 않지만 부스팅 방법이 특히 민감한 것으로 분류되는 이유는 무엇입니까? 부스트 트리, 랜덤 포레스트, 신경망, SVM 및 로지스틱 회귀 분석과 같은 간단한 회귀 분석 방법은 특이 치에 대한 민감도 …


1
jackknifing의 현대적인 사용이 있습니까?
문제 는 부트 스트랩이 잭 나이 핑보다 우수 합니다. 그러나 jackknifing이 모수 추정값의 불확실성을 특성화하기위한 유일하거나 최소한 가능한 옵션이 있는지 궁금합니다. 또한 실제 상황에서 부트 스트랩 핑과 관련하여 편향 / 정확성이 잭 니핑되는 방식은 무엇이며, 잭나이프 결과는보다 복잡한 부트 스트랩이 개발되기 전에 예비 통찰력을 제공 할 수 있습니까? 일부 상황 …

1
무작위 로지스틱 회귀 분석과 일반 바닐라 로지스틱 회귀 분석의 차이점
나는 사이의 차이점을 알고 싶습니다 무작위 로지스틱 회귀 (RLR) 및 일반 로지스틱 회귀 나는 종이 읽고있다, 따라서 (LR)를 "안정성 선택" 으로 등, Meinshausen. ; 그러나 나는 RLR이 무엇이며 RLR과 LR의 차이점이 무엇인지 이해하지 못합니다. 누군가 RLR을 이해하기 위해 읽어야 할 것을 지적 할 수 있습니까? 아니면 간단한 예가 있습니까?


3
선형 회귀 분석에 사용되는 가우스 기본 함수 매개 변수 이해
가우스 기저 함수를 선형 회귀 구현에 적용하고 싶습니다. 불행히도 기본 기능의 몇 가지 매개 변수를 이해하는 데 어려움을 겪고 있습니다. 구체적으로 μμ\mu 및 σσ\sigma 입니다. 내 데이터 세트는 10,000 x 31 행렬입니다. 10,000 개의 샘플과 31 개의 기능. "각 기본 함수는 입력 벡터 x를 스칼라 값으로 변환합니다"를 읽었습니다. 따라서 x는 …

4
교차 유효성 검사를 통해 근거가없는 데이터 집합에서 서로 다른 클러스터링 방법을 비교할 수 있습니까?
현재, 나는 진실이없는 텍스트 문서 데이터 세트를 분석하려고합니다. k-fold cross validation을 사용하여 다른 클러스터링 방법을 비교할 수 있다고 들었습니다. 그러나 과거에 보았던 예는 근거가 있습니다. 이 데이터 세트에서 k-fold 방법을 사용하여 결과를 확인할 수있는 방법이 있습니까?

5
재귀 (온라인) 정규화 된 최소 제곱 알고리즘
누구든지 Tikhonov 정규화 (정규 최소 제곱)에 대한 온라인 (재귀) 알고리즘의 방향을 알려 줄 수 있습니까? 오프라인 설정에서 n-fold cross validation을 사용하여 λ 를 찾은 원래 데이터 세트를 사용하여 β^=(XTX+λI)−1XTYβ^=(XTX+λI)−1XTY\hat\beta=(X^TX+λI)^{−1}X^TY 를 계산 합니다. y = x ^ T \ hat \ beta를 사용하여 주어진 x에 대해 새로운 y 값을 예측할 수 …

2
다중 레이블 분류 문제에 신경망을 적용하는 방법은 무엇입니까?
기술: 문제 영역은 각각 하나 이상의 클래스에 속하는 일련의 특징 벡터가 존재하는 문서 분류로하자. 예를 들어, 문서 doc_1는 Sports및 English범주에 속할 수 있습니다 . 질문: 분류를 위해 신경망을 사용하면 특징 벡터의 레이블은 무엇입니까? 관련이없는 클래스에 0 값이 주어지고 관련 클래스에 1이되도록 모든 클래스를 구성하는 벡터입니까? 따라서 클래스 레이블 목록이 [Sports, …

1
기계 학습을 사용하여 재무 시계열을 예측하는 첫 단계 학습
기계 학습을 사용하여 미래의 재무 시계열 1 단계 이상을 예측하는 방법을 파악하려고합니다. 설명 데이터가 포함 된 재무 시계열이 있으며 모델을 구성한 다음 모델을 사용하여 n 단계를 미리 예측하고 싶습니다. 내가 지금까지 한 일은 : getSymbols("GOOG") GOOG$sma <- SMA(Cl(GOOG)) GOOG$range <- GOOG$GOOG.High-GOOG$GOOG.Low tail(GOOG) GOOG.Open GOOG.High GOOG.Low GOOG.Close GOOG.Volume GOOG.Adjusted sma range …



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.