통계 및 빅 데이터 machine-learning

2

머신 러닝이나 파라미터 추정의 기본 가정 중 하나는 보이지 않는 데이터가 훈련 세트와 동일한 분포에서 나온다고 생각합니다. 그러나 실제 사례의 경우 테스트 세트의 분포가 훈련 세트와 거의 다릅니다. 제품 설명을 약 17,000 개의 클래스로 분류하려는 대규모 다중 분류 문제가 있다고 가정 해보십시오. 훈련 세트는 수업에 치우친 수업이 있기 때문에 일부 …

23 machine-learning classification skewness unbalanced-classes multi-class

2

기계 학습 기술은 "근사 알고리즘"입니까?

최근 cstheory stackexchange에 대한 ML과 같은 질문이 있었고 Powell의 방법, 기울기 강하, 유전자 알고리즘 또는 기타 "근사 알고리즘"을 추천하는 답변을 게시했습니다 . 한 의견에서 누군가이 방법이 "추론"이 아니라 "근사 알고리즘"이라고 말했으며 이론상 최적에 가깝지 않은 경우가 많았습니다 ( "자주 발생하는 지역적 최소"때문에). 다른 사람들도 그것에 동의합니까? 또한 검색 공간의 많은 …

23 machine-learning optimization approximation

3

예측 모델링 경쟁 사이트

저는 Kaggle , TunedIt 및 CrowdAnalytix의 예측 모델링 경쟁에 참여 하고 있습니다 . 이 사이트는 통계 / 기계 학습을위한 "운동"하는 좋은 방법이라는 것을 알았습니다. 알아야 할 다른 사이트가 있습니까? 주최자가 경쟁 업체의 제출물로 이익을 얻으려는 경쟁에 대해 어떻게 생각하십니까? / edit : 여기에 더 완전한 목록이 있습니다 : Kaggle TunedIt …

23 machine-learning predictive-models

5

더 나은 예측 (예 : CV) 성능을 가진 분류 트리의 대안?

더 나은 예측력을 얻을 수있는 분류 트리의 대안을 찾고 있습니다. 내가 다루고있는 데이터에는 설명 변수와 설명 변수 모두에 대한 요소가 있습니다. 이 맥락에서 임의의 숲과 신경망을 발견 한 것을 기억합니다. 전에는 시도한 적이 없지만 그러한 모델링 작업에 대한 또 다른 좋은 후보가 있습니까 (R의 경우)?

23 r machine-learning classification cart

1

xgboost 알고리즘에서 min_child_weight에 대한 설명

xgboost에서 min_child_weight 매개 변수 의 정의 는 다음과 같습니다. 어린이에게 필요한 인스턴스 가중치 (헤 시안)의 최소 합계. 트리 분할 단계에서 인스턴스 가중치의 합계가 min_child_weight보다 작은 리프 노드가 생성되면 빌드 프로세스는 추가 분할을 포기합니다. 선형 회귀 모드에서 이는 단순히 각 노드에 있어야하는 최소 인스턴스 수에 해당합니다. 알고리즘이 클수록 더 보수적입니다. 나는 …

23 machine-learning xgboost hessian

2

부스팅은 어떻게 작동합니까?

부스팅을 이해하는 가장 쉬운 방법은 무엇입니까? 왜 매우 약한 분류기를 "무한대"(완벽하게) 향상시키지 않습니까?

23 machine-learning boosting

3

평신도를위한 충분한 통계

누군가 기본적인 통계 로 충분한 통계 를 설명해 주 시겠습니까? 나는 공학적 배경에서 왔으며 많은 것을 겪었지만 직관적 인 설명을 찾지 못했습니다.

23 machine-learning mathematical-statistics intuition

1

신경망의 비용 함수가 볼록하지 않은 이유는 무엇입니까?

여기에는 비슷한 스레드가 있습니다 ( 신경 네트워크의 비용 함수는 볼록하지 않습니까? ). 나는 거기에 대한 답변의 요점을 이해할 수 없었으며 이것을 다시 요구하는 이유는 몇 가지 문제를 분명히 할 것입니다. 제곱 차분 비용 함수의 합계를 사용하는 경우 궁극적으로 형식의 것을 최적화합니다.ΣNi=1(yi−yi^)2Σi=1N(yi−yi^)2 \Sigma_{i=1}^{N}(y_i - \hat{y_i})^2 여기서 는 훈련 중 실제 레이블 …

22 machine-learning neural-networks optimization loss-functions convex

1

ResNet 건너 뛰기 연결을 통한 그라디언트 역 전파

ResNet 모듈 / 건너 뛰기 연결을 사용하여 그라디언트가 신경망을 통해 어떻게 전파되는지 궁금합니다. ResNet에 대한 몇 가지 질문을 보았습니다 (예 : 스킵 레이어 연결을 가진 신경망 ). 이것은 훈련 중 그라디언트의 역 전파에 대해 특별히 묻습니다. 기본 아키텍처는 다음과 같습니다. 필자는이 논문 인 이미지 인식을위한 잔차 네트워크 연구 (Research of …

22 machine-learning neural-networks conv-neural-network gradient-descent backpropagation

3

숨겨진 레이어 뉴런으로서 Relu vs Sigmoid vs Softmax

Tensorflow에 의해 숨겨진 레이어가 하나 인 간단한 신경망을 가지고 놀고 있었고 숨겨진 레이어에 대해 다른 활성화를 시도했습니다. 렐루 시그 모이 드 Softmax (일반적으로 softmax는 마지막 레이어에서 사용됩니다.) Relu는 최고의 열차 정확도 및 검증 정확도를 제공합니다. 이것을 설명하는 방법을 잘 모르겠습니다. 우리는 Relu가 그라디언트 사라짐과 같은 희소성과 같은 좋은 특성을 가지고 …

22 machine-learning neural-networks conv-neural-network tensorflow sigmoid-curve

4

이 차트의 이름은 오 탐지율과 진양 율을 나타내며 어떻게 생성됩니까?

아래 이미지는 위양성 비율과 실제 양의 비율의 연속 곡선을 보여줍니다. 그러나 내가 즉시 얻지 못하는 것은 이러한 요율이 계산되는 방법입니다. 메소드가 데이터 세트에 적용되는 경우 특정 FP 속도 및 특정 FN 속도가 있습니다. 이것이 각 방법이 곡선이 아닌 단일 점을 가져야한다는 것을 의미하지 않습니까? 물론 방법을 구성하고 여러 가지 다른 …

22 machine-learning data-visualization roc auc

1

적절한 채점 규칙 중에서 선택

적절한 점수 규칙에 대한 대부분의 리소스에는 로그 손실, 브리 어 점수 또는 구면 점수와 같은 여러 가지 점수 규칙이 언급되어 있습니다. 그러나 그들은 종종 그들 사이의 차이점에 대해 많은 지침을 제공하지 않습니다. (A 전시회 : Wikipedia ) 로그 점수를 최대화하는 모델을 선택하는 것은 최대 가능성 모델을 선택하는 것과 일치하며, 이는 …

22 machine-learning classification model-selection theory scoring-rules

2

“바이아 추론 및 기계 학습”다음 단계

저는 현재 David Barber의 "Bayesian Reasoning and Machine Learning"을 겪고 있으며 기초 학습을위한 매우 잘 쓰여지고 매력적인 책입니다. 그래서 이미 이것을 한 누군가에게 질문하십시오. 이발사에서 대부분의 개념을 숙달 한 후에해야 할 다음 책은 무엇입니까?

22 machine-learning bayesian references graphical-model

3

통계학자가 기계 학습을 배우는 것이 중요합니까?

머신 러닝은 통계 학자에게 익숙한 중요한 주제입니까? 머신 러닝은 통계 인 것 같습니다. 통계 프로그램 (학부 및 대학원)이 기계 학습을 요구하지 않는 이유는 무엇입니까?

22 machine-learning careers

2

제한된 Boltzmann 기계 대 다층 신경망

내가 직면하고있는 분류 문제에 대해 신경망을 실험하고 싶었습니다. 나는 RBM에 대해 이야기하는 논문을 접했다. 그러나 내가 이해할 수있는 것은 다층 신경망을 갖는 것과 다르지 않습니다. 이것이 정확합니까? 또한 R로 작업하고 RBM에 대한 통조림 패키지가 보이지 않습니다. 나는 기본적으로 RBM이 쌓여있는 딥 러닝 네트워크에 관해 이야기하는 문헌을 보았지만 R에서 그것들을 구현하려는 …

22 r machine-learning classification neural-networks

«machine-learning» 태그된 질문