«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

3
(깊은) 신경망이 다른 방법을 능가 할 수없는지도 학습 문제가 있습니까?
사람들이 SVM과 커널에 많은 노력을 기울인 것을 보았고 머신 러닝의 출발점으로 꽤 흥미로워 보입니다. 그러나 (항상) 신경망 측면에서 거의 항상 우수한 솔루션을 찾을 수 있다고 생각한다면,이 시대에 다른 방법을 시도하는 의미는 무엇입니까? 여기이 주제에 대한 제약이 있습니다. 우리는지도 학습 만 생각합니다. 회귀 및 분류. 결과의 가독성은 계산되지 않습니다. 지도 학습 …


5
SVM은 한 번에 하나의 예를 스트리밍 학습 할 수 있습니까?
스트리밍 데이터 세트가 있는데 예제를 한 번에 하나씩 사용할 수 있습니다. 나는 그들에 대해 다중 클래스 분류를해야합니다. 학습 과정에 학습 예제를 제공하자마자 예제를 삭제해야합니다. 동시에, 나는 레이블이없는 데이터에 대한 예측을 수행하기 위해 최신 모델을 사용하고 있습니다. 내가 아는 한 신경망은 한 번에 하나의 예제를 제공하고 예제에서 순방향 전파 및 역방향 …

1
부스팅의 상대 변수 중요도
Gradient Boosted Trees에서 상대 변수 중요성이 계산되는 방법에 대한 설명을 찾고 있습니다. 측정 값은 변수가 분할을 위해 선택된 횟수, 각 분할의 결과로 모델의 제곱 개선에 의해 가중치가 부여되고 모든 트리에서 평균화 됩니다. [ Elith et al. 2008, 회귀 트리 향상을위한 작업 가이드 ] 그리고 그것은 덜 추상적입니다. 나는2j^( T) = …

3
숨겨진 Markov 모델과 조건부 랜덤 필드의 직관적 차이
HMM (Hidden Markov Models)은 생성 모델이며 CRF는 차별적 모델이라는 것을 알고 있습니다. 또한 CRF (Conditional Random Fields)가 어떻게 설계되고 사용되는지 이해합니다. 내가 이해하지 못하는 것은 HMM과 어떻게 다른가? HMM의 경우 이전 노드, 현재 노드 및 전이 확률에 대한 다음 상태 만 모델링 할 수 있지만 CRF의 경우이 작업을 수행하고 임의의 …

4
tanh가 활성화 함수로 sigmoid보다 거의 항상 더 나은 이유는 무엇입니까?
Coursera 의 Andrew Ng의 Neural Networks and Deep Learning 과정에서 그는 tanhtanhtanh 를 사용하는 것이 를 사용하는 것보다 거의 항상 바람직 하다고 말합니다 .sigmoidsigmoidsigmoid 그가 준 이유는 's 0.5 대신 center를 사용하는 출력이 약 0이기 때문에 "다음 층에 대한 학습이 조금 더 쉬워진다"는 것입니다.s i g m o i dtanhtanhtanhsigmoidsigmoidsigmoid …

4
정도를 낮추는 대신 다항식 회귀 분석에서 정규화를 사용하는 이유는 무엇입니까?
예를 들어, 회귀를 수행 할 때 선택할 두 개의 하이퍼 매개 변수는 종종 함수의 용량 (예 : 다항식의 최대 지수)과 정규화 량입니다. 내가 혼동하는 것은 왜 저용량 기능을 선택한 다음 정규화를 무시하지 않는 것입니까? 그렇게하면 과잉 적합하지 않습니다. 정규화와 함께 고용량 기능이있는 경우 저용량 기능을 사용하고 정규화하지 않는 것과 동일하지 …

1
임시 네트워크에서 링크 이상 탐지
나는 트랜드 주제를 예측하기 위해 링크 이상 감지를 사용하는이 논문을 발견했으며,이 논문은 "링크 이상 감지를 통해 소셜 스트림에서 신흥 주제 발견" 이라는 놀라운 흥미를 발견했다 . 다른 데이터 세트에 복제하고 싶지만 사용 방법을 알 수있는 방법에 익숙하지 않습니다. 6 개월 동안 일련의 노드 네트워크에 대한 스냅 샷이 있다고 가정 해 …


6
신경망을 시작하는 방법
저는 신경망을 처음 접했지만 이해하는 데 관심이 많습니다. 그러나 시작하기가 쉽지 않습니다. 누구든지 좋은 책이나 다른 종류의 자료를 추천 할 수 있습니까? 반드시 읽어야합니까? 나는 어떤 종류의 팁에 감사합니다.


1
회귀를위한 CNN 아키텍처?
입력이 이미지이고 레이블이 80과 350 사이의 연속적인 값인 회귀 문제를 연구하고 있습니다. 이미지는 반응 후 일부 화학 물질입니다. 밝혀지는 색은 남은 다른 화학 물질의 농도를 나타내며 모델이 출력하는 것입니다-화학 물질의 농도. 이미지를 회전, 뒤집기, 대칭시킬 수 있으며 예상 출력은 여전히 ​​동일해야합니다. 이러한 종류의 분석은 실제 실험실에서 수행됩니다 (매우 전문화 된 …

2
OLS 선형 회귀 분석의 비용 함수
기계 학습에 대한 Coursera의 Andrew Ng가 제공 한 선형 회귀에 대한 강의와 약간 혼동됩니다. 거기서 그는 다음과 같이 제곱합을 최소화하는 비용 함수를 제공했습니다. 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 나는 1을 이해1212\frac{1}{2} 에서 온. 제곱 항에서 도함수를 수행 할 때 제곱 항의 2가 반으로 취소되도록 그렇게했다고 생각합니다. 그러나 나는1을이해하지 못한다.1m1m\frac{1}{m} 왔습니다. …

2
“딥 러닝”과 다단계 / 계층 적 모델링의 차이점은 무엇입니까?
"딥 러닝"은 다단계 / 계층 모델링의 또 다른 용어입니까? 나는 전자보다 후자에 대해 더 잘 알고 있지만, 내가 알 수 있듯이, 주요 차이점은 그들의 정의가 아니라 응용 프로그램 도메인 내에서 어떻게 사용되고 평가되는지입니다. 일반적인 "딥 러닝"애플리케이션의 노드 수는 더 크고 일반적인 계층 적 형식을 사용하는 반면 다중 레벨 모델링의 애플리케이션은 …

2
선형 회귀 모델의 계수를 찾으려면 경사 하강이 필요합니까?
Coursera 자료를 사용하여 기계 학습을 배우려고했습니다 . 이 강의에서 Andrew Ng는 기울기 하강 알고리즘을 사용하여 오차 함수 (비용 함수)를 최소화 할 선형 회귀 모델의 계수를 찾습니다. 선형 회귀의 경우 그라디언트 디센트가 필요합니까? 오차 함수를 분석적으로 차별화하고 계수를 풀기 위해 0으로 설정할 수 있습니다. 맞습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.