«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

3
통계 학자들은 LASSO (정규화)의 작동 방식을 실제로 이해하지 못한다고 말할 때 무엇을 의미합니까?
나는 최근 올가미 (정규화)에 관한 몇 가지 통계 토론에 참석했으며 계속 올라가는 요점은 올가미가 왜 작동하는지 또는 왜 그렇게 잘 작동하는지 이해하지 못한다는 것입니다. 이 진술이 무엇을 말하는지 궁금합니다. 분명히 나는 ​​올가미가 매개 변수 축소로 과적 합을 방지하여 기술적으로 작동하는 이유를 이해하지만 그러한 진술 뒤에 더 깊은 의미가 있는지 궁금합니다. …

1
랜덤 포리스트 결과가 왜 이렇게 가변적입니까?
두 그룹 사이에서 샘플을 분류하는 임의의 포리스트 기능을 테스트하려고합니다. 분류에 사용되는 54 개의 샘플과 다양한 변수가 있습니다. 내가 5 만 그루의 나무를 사용하는 경우에도 가방 외부 (OOB) 추정치가 서로 5 % 정도 차이가 나는 이유가 궁금합니다. 이것이 부트 스트랩이 도움이 될 수있는 것입니까?

1
행렬 함수의 미분에 대한이 계산이 무엇을 정당화합니까?
Andrew Ng의 기계 학습 과정에서 그는 다음 공식을 사용합니다. ∇Atr(ABATC)=CAB+CTABT∇ㅏ티아르 자형(ㅏ비ㅏ티씨)=씨ㅏ비+씨티ㅏ비티\nabla_A tr(ABA^TC) = CAB + C^TAB^T 그는 다음과 같이 빠른 증거를 수행합니다. ∇Atr(ABATC)=∇Atr(f(A)ATC)=∇∘tr(f(∘)ATC)+∇∘tr(f(A)∘TC)=(ATC)Tf′(∘)+(∇∘Ttr(f(A)∘TC)T=CTABT+(∇∘Ttr(∘T)Cf(A))T=CTABT+((Cf(A))T)T=CTABT+CAB∇ㅏ티아르 자형(ㅏ비ㅏ티씨)=∇ㅏ티아르 자형(에프(ㅏ)ㅏ티씨)=∇∘티아르 자형(에프(∘)ㅏ티씨)+∇∘티아르 자형(에프(ㅏ)∘티씨)=(ㅏ티씨)티에프'(∘)+(∇∘티티아르 자형(에프(ㅏ)∘티씨)티=씨티ㅏ비티+(∇∘티티아르 자형(∘티)씨에프(ㅏ))티=씨티ㅏ비티+((씨에프(ㅏ))티)티=씨티ㅏ비티+씨ㅏ비\nabla_A tr(ABA^TC) \\ = \nabla_A tr(f(A)A^TC) \\ = \nabla_{\circ} tr(f(\circ)A^TC) + \nabla_{\circ}tr(f(A)\circ^T C)\\ =(A^TC)^Tf'(\circ) + (\nabla_{\circ^T}tr(f(A)\circ^T C)^T \\ = C^TAB^T + (\nabla_{\circ^T}tr(\circ^T)Cf(A))^T …


2
그래픽 모델과 Boltzmann 기계는 수학적으로 관련이 있습니까?
물리 클래스에서 Boltzmann 기계로 실제로 프로그래밍을 수행했지만 이론적 특성에 익숙하지 않습니다. 대조적으로, 나는 그래픽 모델 이론 (Lauritzen 's Book Graphical Models 의 처음 몇 장에 관한)에 대해 적당히 알고있다 . 질문 : 그래픽 모델과 Boltzmann 머신간에 의미있는 관계가 있습니까? Boltzmann 기계는 그래픽 모델 유형입니까? 분명히 볼츠만 기계는 신경망의 한 유형입니다. …


3
신경망을 훈련시켜 특정 스타일로 그림을 그릴 수 있습니까?
신경망을 훈련시켜 특정 스타일로 그림을 그릴 수 있습니까? (따라서 이미지를 가져와 훈련 된 스타일로 다시 그립니다.) 그런 종류의 물건에 대해 승인 된 기술이 있습니까? DeepArt 알고리즘에 대해 알고 있습니다. 기본 이미지를 특정 패턴 (예 : vangoghify 이미지)으로 채우는 것이 좋지만, 입력 초상화에서 특정 스타일로 만화를 만드는 것과 같은 다른 것을 …

1
신경망은 일반적으로 훈련 중에“킥 인”하는 데 시간이 걸립니까?
역 전파를 사용하여 분류를 위해 심층 신경망을 훈련하려고합니다. 특히, Tensor Flow 라이브러리를 사용하여 이미지 분류에 회선 신경망을 사용하고 있습니다. 훈련하는 동안 이상한 행동을 겪고 있으며 이것이 전형적인 것인지 또는 내가 잘못하고 있는지 궁금합니다. 그래서 내 컨볼 루션 신경망에는 8 개의 레이어 (5 컨볼 루션, 3 개의 완전히 연결된)가 있습니다. 모든 …


1
Pareto 스무딩 중요도 샘플링 (PSIS-LOO) 실패 방지
최근에이 논문에서 설명하는 파레토 스무딩 중요도 샘플링 휴가 교차 검증 (PSIS-LOO)을 사용하기 시작했습니다. Vehtari, A., & Gelman, A. (2015). 파레토는 중요도 샘플링을 완화했습니다. arXiv 프리 프린트 ( link ). Vehtari, A., Gelman, A., & Gabry, J. (2016). leave-one-out 교차 검증 및 WAIC를 사용한 실제 베이지안 모델 평가. arXiv 프리 프린트 …

3
RBF SVM 사용 사례 (로지스틱 회귀 및 임의 포리스트)
지원 벡터 기계 와 방사형 기본 기능 커널은 범용이 분류를 감독이다. 이러한 SVM에 대한 이론적 기초와 장점을 알고 있지만 이들이 선호되는 방법에 대해서는 알지 못합니다. 그렇다면 RBF SVM이 다른 ML 기술보다 우월한 문제가 있습니까? (점수 또는 기타 견고성, 시작하기 쉬움, 해석 가능성 등) 기본 접근 방식은 로지스틱 회귀 (아마도 일부 …


1
PCA가 한 쌍의 큰 거리 만 보존한다는 것은 무엇을 의미합니까?
나는 현재 t-SNE 시각화 기술을 읽고 있으며 고차원 데이터를 시각화하기 위해 PCA (Principal Component Analysis)를 사용하는 단점 중 하나는 점 사이의 큰 쌍 거리를 유지한다는 것입니다. 고차원 공간에서 멀리 떨어져있는 의미 점은 저 차원 부분 공간에서도 멀리 떨어져 있지만 다른 모든 쌍방향 거리는 망칠 수 있습니다. 왜 그런지 이해하고 그래픽으로 …

1
TF-IDF 로그에서 로그 사용 이해
나는 읽고 있었다: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition 그러나 수식이 왜 원래대로 구성되었는지 정확히 이해할 수없는 것 같습니다. 내가 이해하는 것 : iDF는 어떤 수준에서 용어 S가 각 문서에 나타나는 빈도를 측정해야하며, 용어가 더 자주 나타날수록 가치가 감소합니다. 그 관점에서 나는 D F( S) = # 문서의# S를 포함하는 서류나는디에프(에스)=# 문서# S가 포함 된 …

1
랜덤 포레스트 vs Adaboost
논문 Random Forests (Breiman, 1999)의 7 장 에서 저자는 "Adaboost는 랜덤 포레스트"라고 추측합니다. 누구든지 이것을 증명하거나 반증 했습니까? 이 게시물 1999 년을 증명하거나 반증하기 위해 무엇을 했습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.