통계 및 빅 데이터

3

유전자 알고리즘은 최적화 방법의 한 형태입니다. 확률 적 구배 하강과 그 파생물은 함수 최적화를위한 최선의 선택이지만 종종 유전자 알고리즘이 여전히 사용됩니다. 예를 들어, NASA의 ST5 우주선의 안테나 는 유전자 알고리즘으로 만들어졌습니다. 유전자 최적화 방법이 더 일반적인 경사 하강 방법보다 더 나은 선택은 언제입니까?

20 machine-learning optimization gradient-descent genetic-algorithms

3

RNN / LSTM 네트워크의 가중치가 시간이 지남에 따라 공유되는 이유는 무엇입니까?

최근에 LSTM에 관심을 갖게되었으며 시간이 지남에 따라 가중치가 공유된다는 사실에 놀랐습니다. 시간이 지남에 따라 가중치를 공유하면 입력 시간 시퀀스가 가변 길이가 될 수 있습니다. 공유 가중치를 사용하면 훈련 할 매개 변수가 훨씬 적습니다. 내 이해에서 LSTM을 다른 학습 방법과 비교하는 이유는 데이터에 배우고 싶은 시간적 / 순차적 구조 / 의존성이 …

20 machine-learning lstm rnn

3

대수의 조건부 기대에 대한 직감

하자 랜덤 변수 주어진 확률 공간 될 와 -algebra 우리는 조건부 기대 값 인 새로운 임의의 변수 을 구성 할 수 있습니다.( Ω , F , μ ) (Ω,F,μ)(\Omega,\mathscr{F},\mu)ξ : Ω → Rξ:Ω→R\xi:\Omega \to \mathbb{R} σ σ\sigmaG ⊆ FG⊆F\mathscr{G}\subseteq \mathscr{F} E [ ξ | G ]E[ξ|G]E[\xi|\mathscr{G}] 대한 생각의 직관은 정확히 …

20 probability conditional-probability conditional-expectation conditioning sigma-algebra

2

규범의 맥락에서 수퍼 스크립트 2 아래 첨자 2의 의미는 무엇입니까?

최적화가 처음입니다. 나는 규범의 오른쪽에 첨자 2와 첨자 2가있는 방정식 을 계속 봅니다 . 예를 들어 여기에 최소 제곱 방정식이 있습니다 분||Ax−b||22||Ax−b||22 ||Ax-b||^2_2 나는 위첨자 2를 이해한다고 생각한다. 그것은 규범의 가치를 제곱하는 것을 의미한다. 그러나 아래 첨자 2는 무엇입니까? 이 방정식을 어떻게 읽어야합니까?

20 regression optimization notation

3

오차와 잔차의 차이는 무엇입니까?

이 두 가지 유비쿼터스 용어는 종종 동의어로 사용되지만 때로는 구별이있는 것 같습니다. 실제로 차이가 있습니까, 아니면 정확히 동의어입니까?

20 residuals error terminology

1

앙상블 학습의 k- 폴드 교차 검증

앙상블 학습의 k- 폴드 교차 검증을 위해 데이터를 분할하는 방법에 대해 혼란스러워합니다. 분류를위한 앙상블 학습 프레임 워크가 있다고 가정합니다. 첫 번째 계층에는 분류 모델 (예 : svm, 의사 결정 트리)이 있습니다. 두 번째 레이어에는 첫 번째 레이어의 예측을 결합하고 최종 예측을 제공하는 투표 모델이 포함되어 있습니다. 5 배 교차 검증을 …

20 classification cross-validation ensemble

3

예상되는 예측 오류-도출

특히 2.11 및 2.12의 유도 (컨디셔닝, 포인트 단위 최소 단계)에 따라 아래의 예상 예측 오류 (ESL)의 도출을 이해하는 데 어려움을 겪고 있습니다. 모든 포인터 또는 링크는 대단히 감사합니다. 아래는 ESL pg에서 발췌 한 내용입니다. 처음 두 방정식은 순서대로 방정식 2.11과 2.12입니다. 하자 실제 값 랜덤 입력 벡터와 나타내고 조인트 분포와 …

20 regression prediction error

1

원격 감독 : 감독, 반 감독 또는 둘 다?

"원격 감독"은 약하게 분류 된 훈련 세트가 주어지면 분류자가 학습되는 학습 체계입니다 (훈련 데이터는 휴리스틱 / 규칙에 따라 자동으로 표시됩니다). 레이블이있는 데이터에 경험적 / 자동으로 레이블이 지정된 경우 감독 학습과 준 감독 학습 모두 그러한 "원격 감독"을 포함 할 수 있다고 생각합니다. 그러나이 페이지 에서 "원격 감독"은 "반 감독 학습"(즉, …

20 machine-learning data-mining dataset references unsupervised-learning

1

SHAP (Shapley Additive Description)와 LIME (Local Interpretable Model-Agnostic Descriptions)의 비교

두 가지 인기있는 포스트 모델 해석 기술에 대해 읽고 있습니다 : LIME 및 SHAP 이 두 기술의 주요 차이점을 이해하는 데 어려움을 겪고 있습니다. SHAP의 핵심 인 Scott Lundberg 를 인용 하면 : SHAP 값은 LIME의 블랙 박스 로컬 추정 이점과 함께 제공되며 게임 이론의 일관성 및 로컬 정확도에 대한 …

20 model-interpretation shapley-value lime

4

CNN을 사용하여 1D 신호를 분류하는 것이 좋습니다?

수면 단계 분류 작업을하고 있습니다. 나는이 주제에 관한 몇몇 연구 기사를 읽었으며 그 중 많은 것들이 SVM 또는 앙상블 방법을 사용했습니다. 1 차원 EEG 신호를 분류하기 위해 회선 신경망을 사용하는 것이 좋은 생각입니까? 나는 이런 종류의 일에 처음이다. 내가 잘못 물어 보면 용서해주세요

20 neural-networks svm conv-neural-network signal-processing

1

Metropolis-Hastings 대신 Gibbs 샘플링을 언제 사용합니까?

MCMC 알고리즘에는 여러 종류가 있습니다. 대도시 해 스팅 깁스 중요성 / 거부 샘플링 (관련). Metropolis-Hastings 대신 Gibbs 샘플링을 사용하는 이유는 무엇입니까? Metropolis-Hastings보다 Gibbs 샘플링에서 추론이 더 다루기 쉬운 경우가 있다고 생각하지만 구체적인 내용은 명확하지 않습니다.

20 bayesian simulation mcmc gibbs metropolis-hastings

1

로지스틱 회귀 분석에서 조정 된 승산 비 이해하기

나는 논문에서 로지스틱 회귀의 사용을 이해하려고 애썼다. 사용할 수있는 종이 여기가 백내장 수술 중 합병증의 가능성을 예측하기 위해 로지스틱 회귀 분석을 사용합니다. 나를 혼란스럽게하는 것은 종이가 다음과 같이 1에 대한 승산 비를 기준선에 할당하는 모델을 제시한다는 것입니다. 위험 프로파일이 모든 위험 지표에 대해 기준 그룹에있는 환자 (즉, 표 1의 모든 …

20 logistic odds-ratio

2

익스트림 러닝 머신 : 그게 다 뭐에요?

저는 1 년 이상 ELM (Extreme Learning Machine) 패러다임을 생각하고 구현하고 사용하고 있으며, 더 오래할수록 실제로 좋은 일인지 의심합니다. 그러나 내 의견은 인용과 새로운 출판물을 측정 할 때 인기있는 주제 인 과학계와는 대조되는 것 같습니다. ELM은 Huang 등에 의해 소개되었습니다 . 알. 기본 아이디어는 다소 간단합니다. 2 계층 인공 신경망으로 …

20 regression

1

분류에서 훈련 데이터를 생성하기위한 계층화 및 무작위 샘플링의 이점

원래 데이터 세트를 분류를위한 훈련 및 테스트 세트로 분할 할 때 무작위 샘플링 대신 계층화 샘플링을 사용하면 어떤 이점이 있는지 알고 싶습니다. 또한 계층화 된 샘플링이 무작위 샘플링보다 분류기에 더 많은 편향을 가져 옵니까? 데이터 준비를 위해 계층화 된 샘플링을 사용하려는 응용 프로그램은 2에 대해 훈련 된 Random Forests 분류기입니다.2삼2삼\frac{2}{3}원래 …

20 classification cross-validation random-forest train stratification

1

xgboost의 초과 적합에 대한 토론

내 설정은 다음과 같습니다. "Applied Predictive Modelling"의 지침을 따르고 있습니다. 따라서 상관 된 기능을 필터링하고 다음과 같이 끝납니다. 훈련 세트의 4900 데이터 포인트와 테스트 세트의 1600 데이터 포인트 26 개의 기능이 있으며 대상은 연속 변수입니다. caret패키지를 사용하여 모델을 훈련시키기 위해 5 배 교차 검증을 적용 합니다. MARS 모델을 적용하면 훈련 …

20 machine-learning boosting overfitting