현재 Octave에서 작업하고 있지만 문서화가 좋지 않아 진행 속도가 매우 느립니다. 어떤 언어는 배우고 사용하기 쉽고 기계 학습 문제를 해결하기 위해 잘 문서화되어 있습니까? 작은 데이터 세트 (수천 개의 예제)에서 프로토 타입을 제작하려고하므로 속도는 중요하지 않습니다. 편집 : 추천 엔진을 개발 중입니다. 따라서 정규 선형 회귀, 신경망, SVN 또는 공동 …
실수를 확률로 변환하기 위해 신경망에서 일반적으로 사용되는 softmax 함수는 열역학에서 주어진 온도 T에서 열 평형에서 입자의 앙상블에 대한 에너지에 대한 확률 분포 인 Boltzmann 분포와 동일한 기능입니다. 이것이 실용적인 이유에 대한 명확한 휴리스틱 이유를 볼 수 있습니다. 입력 값이 음수인지에 관계없이 softmax는 1에 해당하는 양수 값을 출력합니다. 항상 차별화가 가능하므로 …
주교의 패턴 인식 및 기계 학습 에서 확률 밀도 가 소개 된 .p(x∈(a,b))=∫bap(x)dxp(x∈(a,b))=∫abp(x)dxp(x\in(a,b))=\int_a^bp(x)\textrm{d}x 변수의 비선형 적 변화에서 확률 밀도는 야 코비 행렬 (Jacobian factor)로 인해 간단한 함수와 다르게 변형됩니다. 예를 들어 변수 의 변경을 고려하면 함수 는 됩니다. 이제 새 변수 와 관련하여 밀도 해당 하는 확률 밀도 를 고려하십시오 …
최근에 XGBoost 알고리즘을 검토 한 결과이 알고리즘이 교육 단계에서 누락 된 데이터 (대치없이)를 처리 할 수 있음을 알았습니다. XGboost가 새로운 관측치를 예측하는 데 사용되거나 누락 된 데이터를 대치해야 할 때 누락 된 데이터 (대치없이)를 처리 할 수 있는지 궁금합니다. 미리 감사드립니다.
강화 학습에서 선형 함수 근사법은 큰 상태 공간이 존재할 때 종종 사용됩니다. 조회 테이블을 사용할 수 없게 될 때. 의 형태 선형 함수로 근사 값으로 주어진다Q -Q−Q- Q ( s , a ) = w1에프1( s , a ) + w2에프2( s , a ) + ⋯ ,Q(s,a)=w1f1(s,a)+w2f2(s,a)+⋯,Q(s,a) = w_1 …
PRML을 읽고 있는데 그림을 이해하지 못합니다. 그림을 이해하기위한 힌트와 가우시안 분포의 분산 MLE이 왜 편향 될 수 있습니까? 공식 1.55 : 공식 1.56 σ 2 M L E =1μ미디엄L E= 1엔∑n = 1엔엑스엔μ미디엄엘이자형=1엔∑엔=1엔엑스엔 \mu_{MLE}=\frac{1}{N} \sum_{n=1}^N x_n σ2미디엄L E= 1엔∑n = 1엔( x엔− μ미디엄L E)2σ미디엄엘이자형2=1엔∑엔=1엔(엑스엔−μ미디엄엘이자형)2 \sigma_{MLE}^2=\frac{1}{N}\sum_{n=1}^{N}(x_n-\mu_{MLE})^2
최대 우도 추정을 공부하는 동안 최대 우도 추정을 추론하려면 분산을 알아야합니다. 분산을 찾으려면 Cramer의 Rao Lower Bound를 알아야합니다.이 곡선은 곡률에 두 번째 편차가있는 Hessian Matrix와 같습니다. 공분산 행렬과 헤 시안 행렬 간의 관계를 정의하기 위해 혼합되어 있습니다. 질문에 대한 설명을들을 수 있기를 바랍니다. 간단한 예가 이해 될 것이다.
6 개의 수업에 문제가 있습니다. 그래서 다음과 같이 멀티 클래스 분류기를 작성합니다. 각 클래스마다 One vs. All을 사용하여 하나의 Logistic Regression 분류 기가 있습니다. 즉, 6 개의 다른 분류자가 있습니다. 분류기 각각에 대해 혼동 매트릭스를보고 할 수 있습니다. 그러나 여기 많은 예에서 보았 듯이 모든 분류 자에 대한 혼동 행렬을보고하고 …
Decision Stump를 사용하여 Adaboost를 구현하고 싶습니다. Adaboost를 반복 할 때마다 데이터 세트의 기능만큼 많은 의사 결정을 내릴 수 있습니까? 예를 들어, 24 개의 기능이있는 데이터 세트가있는 경우 각 반복마다 24 개의 의사 결정 스텀프 분류 기가 있어야합니까? 아니면 무작위로 일부 기능을 선택하고 모든 기능 대신 분류기를 만들어야합니까?
누군가가 128에서 4000 사이의 로그 균등 분포에서 데이터가 샘플링되었다고 말하면 무엇을 의미합니까? 균일 분포의 샘플링과 다른 점은 무엇입니까? 이 백서를 참조하십시오 : http://www.jmlr.org/papers/volume13/bergstra12a/bergstra12a.pdf 감사!
Predicted class Cat Dog Rabbit Actual class Cat 5 3 0 Dog 2 3 1 Rabbit 0 2 11 정밀도를 계산하고 리콜하는 방법 F1- 점수를 쉽게 계산할 수 있습니다. 일반적인 혼란 매트릭스는 2 x 2 차원입니다. 그러나 3 x 3이되면 정밀도를 계산하고 호출하는 방법을 모릅니다.
최근에 나는 문헌에서 '무우 행 (freelihood-free)'방법이 사용되는 것을 알고있다. 그러나 나는 그것이 될 추론 또는 최적화 방법에 대해 무엇을 의미하는지에 취소하고 있지 않다 가능성이없는 . 기계 학습에서 목표는 보통 신경망의 가중치와 같은 기능에 맞는 일부 매개 변수의 가능성을 최대화하는 것입니다. 그렇다면 가능성이없는 접근법 의 철학은 정확히 무엇이며 GAN과 같은 적대적인 …