«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
사전 훈련이란 무엇이며 신경망을 어떻게 사전 훈련합니까?
사전 교육은 기존 교육의 일부 문제를 피하기 위해 사용됩니다. 자동 인코더와 함께 역 전파를 사용하면 역 전파가 느리고 시간이 오래 걸리고 현지 최적화에 얽매여 특정 기능을 배울 수 없기 때문에 시간 문제가 발생한다는 것을 알고 있습니다. 내가 이해하지 못하는 것은 네트워크를 사전 훈련시키는 방법과 사전 훈련을 위해 특별히하는 일입니다. 예를 …

1
k- 최근 접 이웃의 VC 치수
k가 사용 된 트레이닝 포인트의 수와 동일한 경우 k- 최근 접 이웃 알고리즘의 VC- 차원은 무엇입니까? 컨텍스트 : 이 질문은 제가 수강하는 과정에서 요청되었으며 거기에 주어진 답은 0입니다. 그러나 이것이 왜 그런지 이해하지 못합니다. 내 직감은 VC 차원이 1이어야한다는 것입니다. 모든 모델이 첫 번째 모델에 따라 한 클래스에 속하고 다른 …

3
타임 시리즈 분석과 머신 러닝?
일반적인 질문입니다. 시계열 데이터가있는 경우 기계 / 통계 학습 기법 (KNN, 회귀)보다 시계열 기법 (일명 ARCH, GARCH 등)을 사용하는 것이 더 좋은 방법은 무엇입니까? 교차 검증 된 유사한 질문이있는 경우, 저를 찾아서 찾을 수없는 문제에 대해 알려주십시오.

2
작은 표본 크기 데이터에 대한 훈련, 교차 검증 및 테스트 세트 크기를 선택하는 방법은 무엇입니까?
샘플 크기가 작고 (예 : N = 100) 두 개의 클래스가 있다고 가정합니다. 머신 러닝을위한 교육, 교차 검증 및 테스트 세트 크기를 어떻게 선택해야합니까? 나는 직관적으로 선택합니다 훈련 세트 크기는 50 교차 검증 세트 크기 25 및 테스트 크기는 25입니다. 그러나 아마도 이것은 다소 의미가 있습니다. 이 값들을 어떻게 결정해야합니까? …

1
PR 곡선 아래 영역의 해석
현재 세 가지 방법을 비교하고 있으며 정확도, auROC 및 auPR을 메트릭으로 사용하고 있습니다. 그리고 나는 다음과 같은 결과를 얻었습니다. 방법 A-acc : 0.75, auROC : 0.75, auPR : 0.45 방법 B-acc : 0.65, auROC : 0.55, auPR : 0.40 방법 C-acc : 0.55, auROC : 0.70, auPR : 0.65 나는 …

2
구성 요소의 수를 선택하기 위해 PCA 적합의 품질을 평가하기위한 좋은 메트릭은 무엇입니까?
주요 성분 분석 (PCA)의 품질을 평가하기위한 좋은 지표는 무엇입니까? 데이터 세트에서이 알고리즘을 수행했습니다. 저의 목표는 기능의 수를 줄이는 것이 었습니다 (정보는 매우 중복되었습니다). 분산의 백분율이 유지하는 정보의 양을 나타내는 좋은 지표라는 것을 알고 있습니다. 중복 정보를 제거하고 그러한 정보를 '손실'하지 않았는지 확인하는 데 사용할 수있는 다른 정보 메트릭이 있습니까?

2
이상 감지 : 어떤 알고리즘을 사용해야합니까?
컨텍스트 : 임상 데이터를 분석하여 오타가 될 수없는 데이터를 필터링하는 시스템을 개발 중입니다. 내가 지금까지 한 일 : 타당성을 정량화하기 위해 지금까지의 시도는 데이터를 정규화 한 다음 세트 D에서 알려진 데이터 포인트까지의 거리를 기준으로 포인트 p에 대한 타당성 값을 계산하는 것입니다 (= 훈련 세트). 타당성 ( p ) = ∑큐∈ …

1
교육 및 테스트 세트를 사용하여 회귀 모델의 성능을 평가하십니까?
테스트 세트를 보유하고 트레이닝 세트에서 모델을 훈련하여 분류 모델의 성능을 평가하는 것에 대해 종종 듣습니다. 그런 다음 예측 된 값과 실제 값을위한 2 개의 벡터를 만듭니다. 분명히 비교를 수행하면 F-Score, Kappa Statistic, Precision & Recall, ROC 곡선 등을 사용하여 예측력으로 모델의 성능을 판단 할 수 있습니다. 이것은 회귀와 같은 수치 …

1
생존 분석을위한 CPH, 가속 장애 시간 모델 또는 신경망 비교
나는 생존 분석에 익숙하지 않으며 최근에 특정 목표가 주어지면 그것을 수행하는 다른 방법이 있다는 것을 배웠습니다. 이러한 방법의 실제 구현 및 적절성에 관심이 있습니다. 나는 시간, 상태 및 기타 의료 데이터를 고려하여 환자의 생존을 얻는 방법으로 전통적인 콕스 비례 위험 , 가속 장애 시간 모델 및 신경망 (다층 퍼셉트론)을 제시했습니다. …

2
조건부 독립성 및 그래픽 표현 관련
공분산 선택을 연구 할 때 한 번 다음 예제를 읽었습니다. 다음 모델과 관련하여 : 공분산 행렬과 역공 분산 행렬은 다음과 같습니다. 와 y 의 독립성이 왜 역공 분산에 의해 결정 되는지 이해가되지 않습니까?엑스xx와이yy 이 관계의 기본이되는 수학적 논리는 무엇입니까? 또한, 다음 그림의 왼쪽 그래프는 와 y 사이의 독립 관계를 캡처한다고 …

1
의사 결정 트리 변수 (기능) 스케일링 및 변수 (기능) 정규화 (튜닝) 어떤 구현에 필요합니까?
많은 머신 러닝 알고리즘에서 기능 스케일링 (일명 가변 스케일링, 정규화)은 일반적인 선행 단계입니다. Wikipedia-Feature Scaling- 이 질문은 끝났 습니다 의사 결정 트리와 관련하여 특별히 두 가지 질문이 있습니다. 기능 확장이 필요한 의사 결정 트리 구현이 있습니까? 대부분의 알고리즘 분할 기준이 확장에 무관심하다는 인상을 받고 있습니다. 다음 변수를 고려하십시오. (1) 단위, …

6
머신 러닝에서 유연하고 융통성없는 모델
다양한 시나리오에서 유연한 모델 (예 : 스플라인)과 유연한 모델 (예 : 선형 회귀)을 비교하는 간단한 질문을 받았습니다. 질문은 ~이야: 일반적으로 다음과 같은 경우에 유연한 통계 학습 방법의 성능이 유연성이없는 방법보다 더 우수하거나 더 나빠질 것으로 예상합니까? 예측 변수 는 매우 크며 관측치 은 적습니까? 피피p엔엔n 오차항의 편차, 즉 σ2= Var …

4
신경망 가중치의 수렴
500 번의 반복 후에도 신경망의 가중치가 수렴하지 않는 상황에 도달했습니다. 내 신경망에는 1 입력 레이어, 1 숨겨진 레이어 및 1 출력 레이어가 있습니다. 입력 레이어에는 약 230 개의 노드, 숨겨진 레이어에는 9 개의 노드, 출력 레이어에는 1 개의 출력 노드가 있습니다. 조기 정지 조건 (100 회 반복 후 신경망 훈련 …

3
모집단 R 제곱 변경에 대한 신뢰 구간을 얻는 방법
간단한 예제를 위해 두 개의 선형 회귀 모델이 있다고 가정합니다. 모델 1은이 세 가지 예측, x1a, x2b, 및x2c 모형 2에는 모형 1의 예측 변수 3 개와 추가 예측 변수 2 개가 x2a있으며x2b 설명 된 모집단 분산이 모형 1의 경우 ρ2( 1 )ρ(1)2\rho^2_{(1)} 이고 모형 2의 경우 모집단 회귀 방정식이 있습니다. …

1
ARIMA 모델의 관측치 48에서 혁신적인 특이 치를 어떻게 통합합니까?
데이터 세트를 작업 중입니다. 일부 모델 식별 기술을 사용한 후 ARIMA (0,2,1) 모델을 만들었습니다. R detectIO의 패키지 TSA에 있는 함수를 사용하여 48 번째 원본 데이터 세트에서 혁신적인 이상치 (IO) 를 감지했습니다 . 이 특이 치를 내 모델에 어떻게 통합하여 예측 목적으로 사용할 수 있습니까? R에서 예측할 수 없기 때문에 ARIMAX …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.