«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.


5
기계 학습 문제를 프로토 타이핑하기 위해 어떤 프로그래밍 언어를 권장합니까?
현재 Octave에서 작업하고 있지만 문서화가 좋지 않아 진행 속도가 매우 느립니다. 어떤 언어는 배우고 사용하기 쉽고 기계 학습 문제를 해결하기 위해 잘 문서화되어 있습니까? 작은 데이터 세트 (수천 개의 예제)에서 프로토 타입을 제작하려고하므로 속도는 중요하지 않습니다. 편집 : 추천 엔진을 개발 중입니다. 따라서 정규 선형 회귀, 신경망, SVN 또는 공동 …

2
ML의 softmax 기능과 열역학의 Boltzmann 분포 사이의 연결은 얼마나 깊습니까?
실수를 확률로 변환하기 위해 신경망에서 일반적으로 사용되는 softmax 함수는 열역학에서 주어진 온도 T에서 열 평형에서 입자의 앙상블에 대한 에너지에 대한 확률 분포 인 Boltzmann 분포와 동일한 기능입니다. 이것이 실용적인 이유에 대한 명확한 휴리스틱 이유를 볼 수 있습니다. 입력 값이 음수인지에 관계없이 softmax는 1에 해당하는 양수 값을 출력합니다. 항상 차별화가 가능하므로 …


1
Jacobian factor로 인한 다른 확률 밀도 변환
주교의 패턴 인식 및 기계 학습 에서 확률 밀도 가 소개 된 .p(x∈(a,b))=∫bap(x)dxp(x∈(a,b))=∫abp(x)dxp(x\in(a,b))=\int_a^bp(x)\textrm{d}x 변수의 비선형 적 변화에서 확률 밀도는 야 코비 행렬 (Jacobian factor)로 인해 간단한 함수와 다르게 변형됩니다. 예를 들어 변수 의 변경을 고려하면 함수 는 됩니다. 이제 새 변수 와 관련하여 밀도 해당 하는 확률 밀도 를 고려하십시오 …

1
XGBoost는 예측 단계에서 누락 된 데이터를 처리 할 수 ​​있습니다
최근에 XGBoost 알고리즘을 검토 한 결과이 알고리즘이 교육 단계에서 누락 된 데이터 (대치없이)를 처리 할 수 ​​있음을 알았습니다. XGboost가 새로운 관측치를 예측하는 데 사용되거나 누락 된 데이터를 대치해야 할 때 누락 된 데이터 (대치없이)를 처리 할 수 ​​있는지 궁금합니다. 미리 감사드립니다.


1
가우스 분포에서 MLE of Variance가 바이어스됨을 이해하는 방법은 무엇입니까?
PRML을 읽고 있는데 그림을 이해하지 못합니다. 그림을 이해하기위한 힌트와 가우시안 분포의 분산 MLE이 왜 편향 될 수 있습니까? 공식 1.55 : 공식 1.56 σ 2 M L E =1μ미디엄L E= 1엔∑n = 1엔엑스엔μ미디엄엘이자형=1엔∑엔=1엔엑스엔 \mu_{MLE}=\frac{1}{N} \sum_{n=1}^N x_n σ2미디엄L E= 1엔∑n = 1엔( x엔− μ미디엄L E)2σ미디엄엘이자형2=1엔∑엔=1엔(엑스엔−μ미디엄엘이자형)2 \sigma_{MLE}^2=\frac{1}{N}\sum_{n=1}^{N}(x_n-\mu_{MLE})^2


1
헤 시안 행렬과 공분산 행렬의 관계
최대 우도 추정을 공부하는 동안 최대 우도 추정을 추론하려면 분산을 알아야합니다. 분산을 찾으려면 Cramer의 Rao Lower Bound를 알아야합니다.이 곡선은 곡률에 두 번째 편차가있는 Hessian Matrix와 같습니다. 공분산 행렬과 헤 시안 행렬 간의 관계를 정의하기 위해 혼합되어 있습니다. 질문에 대한 설명을들을 수 있기를 바랍니다. 간단한 예가 이해 될 것이다.

3
멀티 클래스 분류기의 혼동 행렬을 작성하는 방법은 무엇입니까?
6 개의 수업에 문제가 있습니다. 그래서 다음과 같이 멀티 클래스 분류기를 작성합니다. 각 클래스마다 One vs. All을 사용하여 하나의 Logistic Regression 분류 기가 있습니다. 즉, 6 개의 다른 분류자가 있습니다. 분류기 각각에 대해 혼동 매트릭스를보고 할 수 있습니다. 그러나 여기 많은 예에서 보았 듯이 모든 분류 자에 대한 혼동 행렬을보고하고 …

1
Adaboost에서 의사 결정 그루터기를 약한 학습자로 사용하는 방법은 무엇입니까?
Decision Stump를 사용하여 Adaboost를 구현하고 싶습니다. Adaboost를 반복 할 때마다 데이터 세트의 기능만큼 많은 의사 결정을 내릴 수 있습니까? 예를 들어, 24 개의 기능이있는 데이터 세트가있는 경우 각 반복마다 24 개의 의사 결정 스텀프 분류 기가 있어야합니까? 아니면 무작위로 일부 기능을 선택하고 모든 기능 대신 분류기를 만들어야합니까?



4
가능성이없는 추론-무슨 뜻입니까?
최근에 나는 문헌에서 '무우 행 (freelihood-free)'방법이 사용되는 것을 알고있다. 그러나 나는 그것이 될 추론 또는 최적화 방법에 대해 무엇을 의미하는지에 취소하고 있지 않다 가능성이없는 . 기계 학습에서 목표는 보통 신경망의 가중치와 같은 기능에 맞는 일부 매개 변수의 가능성을 최대화하는 것입니다. 그렇다면 가능성이없는 접근법 의 철학은 정확히 무엇이며 GAN과 같은 적대적인 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.