«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
관계형 데이터로부터 학습
설정 많은 알고리즘이 단일 관계 또는 테이블에서 작동하지만 많은 실제 데이터베이스는 정보를 여러 테이블에 저장합니다 (Domingos, 2003). 질문 여러 (관계형) 테이블에서 어떤 유형의 알고리즘이 잘 학습됩니까 ? 특히 회귀 및 분류 작업에 적용 할 수있는 알고리즘에 관심이 있습니다 (예 : 네트워크 분석 중심이 아닌 링크 예측). 다음과 같은 여러 가지 …

1
LSA와 pLSA의 파렐
pLSA 의 원본 논문 에서 저자 인 Thomas Hoffman은 제가 논의하고자하는 pLSA와 LSA 데이터 구조 사이에 유사점을 두었습니다. 배경: 정보 검색에서 영감을 얻은 것은 NNN 서류 D={d1,d2,....,dN}D={d1,d2,....,dN}D = \lbrace d_1, d_2, ...., d_N \rbrace 그리고 어휘 MMM 자귀 Ω={ω1,ω2,...,ωM}Ω={ω1,ω2,...,ωM}\Omega = \lbrace \omega_1, \omega_2, ..., \omega_M \rbrace 코퍼스 XXX 로 나타낼 …

5
사전 클러스터링이 더 나은 예측 모델을 구축하는 데 도움이됩니까?
이탈 모델링 작업을 위해 다음을 고려했습니다. 데이터에 대한 k 개의 클러스터 계산 각 클러스터에 대해 k 개의 모델을 개별적으로 빌드하십시오. 그 이유는, 서브 스크 라이버의 집단이 동 질적이라는 것을 증명할 것이 없다는 것의 근거이다. 내 질문은 적절한 방법입니까? 위반 사항이 있거나 어떤 이유로 나쁜 것으로 간주됩니까? 그렇다면 왜 그렇습니까? 그렇지 …


1
관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?
4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
NN 아키텍처를 동적으로 조정 : 불필요한 발명?
저는 박사 과정을 시작하고 있으며, 제가 스스로 결정한 궁극적 인 목표는 작업 환경을 모니터링하고 당면한 문제에 맞게 아키텍처를 동적으로 조정하는 ANN을 개발하는 것입니다. 데이터 세트가 연속적이지 않고 시간이 지나도 변경되지 않는 경우 왜 조정해야합니까? 가장 큰 문제는 최근에 딥 러닝이 등장함에 따라 여전히 관련 주제입니까? FFNN은 개념 드리프트 문제에서 틈새 …

2
혼합 모델을위한 파라 메트릭, 세미 파라 메트릭 및 비 파라 메트릭 부트 스트랩
이 기사 에서 다음과 같은 이식편을 가져옵니다 . 부트 스트랩을 사용하고 R boot패키지가있는 선형 혼합 모델을 위해 파라 메트릭, 반 파라 메트릭 및 비 파라 메트릭 부트 스트랩 부트 스트랩을 구현하려고 초보자 입니다. R 코드 내 R코드 는 다음과 같습니다 . library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
데이터 세트에서 가능한 최고의 성능
분류와 같은 간단한 기계 학습 문제가 있다고 가정 해보십시오. 비전 또는 오디오 인식에 대한 일부 벤치 마크에서, 나는 인간으로서 매우 훌륭한 분류 자입니다. 그러므로 나는 분류자가 얼마나 잘 얻을 수 있는지에 대한 직감을 가지고 있습니다. 그러나 많은 데이터를 통해 한 가지 요점은 내가 훈련시키는 분류 기가 얼마나 좋은지 알 수 …

1
하나의 우세 예측 변수로 분류
나는 (케이케이k-클래스) 분류 문제, 100 개의 실제 예측 변수 순서 중 하나가 다른 하나보다 설명력이 훨씬 높은 것으로 보입니다. 다른 변수의 효과에 대해 더 깊이 알고 싶습니다. 그러나 표준 머신 러닝 기술 (임의의 포리스트, SVM 등)은 하나의 강력한 예측 변수에 휩싸여있는 것 같습니다. 이것이 회귀 문제라면, 간단히 강력한 예측 변수에 …

2
감정 분석 이해 및 적용
방금 일부 문서 수집에 대한 감정 분석을 수행하는 프로젝트가 배정되었습니다. 인터넷 검색으로 많은 정서 관련 연구가 나타났습니다. 내 질문은 : 기계 학습 및 통계 분석 분야에서 감정 분석을위한 주요 방법 / 알고리즘은 무엇입니까? 잘 확립 된 결과가 있습니까? 감정 분석을 수행 할 수있는 기존 오픈 소스 소프트웨어가 있습니까?

2
SVM 입력 변수에 대해 R에서 유전자 알고리즘 변수 선택을 수행하는 방법은 무엇입니까?
R 의 kernlab 패키지를 사용하여 일부 데이터를 분류하기위한 SVM을 작성하고 있습니다. SVM은 적절한 정확도의 '예측'을 제공한다는 점에서 훌륭하게 작동하지만 입력 변수 목록이 원하는 것보다 커서 다른 변수의 상대적 중요성에 대해 확신이 없습니다. 최고의 알고리즘 / 적합한 SVM을 생성하는 입력 변수의 하위 집합을 선택하기 위해 유전자 알고리즘을 구현하고 싶습니다. 이 GA …

2
분류를 위해 훈련 세트에서 중복 제거
분류 문제에 대해 많은 행이 있다고 가정 해 봅시다. 엑스1, . . .엑스엔, YX1,...XN,YX_1, ... X_N, Y 어디 엑스1, . . . ,엑스엔X1,...,XNX_1, ..., X_N 기능 / 예측 자와 와이YY 행의 기능 조합이 속한 클래스입니다. 많은 기능 조합과 해당 클래스가 데이터 세트에서 반복되어 분류기에 적합합니다. 중복을 제거 할 수 있는지 …

1
기존의 다중 입력 최대 엔트로피 분류기에서 최대 엔트로피 Markov 모델 만들기
나는 최대 엔트로피 마르코프 모델 (MEMM)의 개념에 흥미가 있으며, 그것을 품사 (POS) 태거에 사용할 생각입니다. 현재는 기존의 최대 엔트로피 (ME) 분류기를 사용하여 각 개별 단어에 태그를 지정하고 있습니다. 이것은 앞의 두 태그를 포함하여 많은 기능을 사용합니다. MEMM은 Viterbi 알고리즘을 사용하여 Markov Chain을 통한 최적의 경로를 찾습니다 (즉, 각 단어에 대한 …

1
PCA와 LSA / LSI를 선택해야하는시기
질문: PCA와 LSA / LSI의 적용 여부를 결정하는 데 사용할 수있는 입력 데이터 특성에 대한 일반적인 지침이 있습니까? PCA와 LSA / LSI에 대한 간략한 요약 : PCA (Principle Component Analysis)와 LSA (Latent Semantic Analysis) 또는 LSI (Latent Semantic Indexing)는 모두 SVD (Singular Value Decomposition)를 행렬에 적용하는 데 기본적으로 의존한다는 점에서 …

1
SVM으로 불균형 멀티 클래스 데이터 세트를 처리하는 가장 좋은 방법
상당히 불균형 한 데이터에서 SVM을 사용하여 예측 모델을 작성하려고합니다. 레이블 / 출력에는 양, 중, 음의 세 가지 클래스가 있습니다. 긍정적 인 예는 내 데이터의 약 10-20 %, 중립 약 50-60 %, 음의 약 30-40 %를 말합니다. 수업 중 잘못된 예측과 관련된 비용이 같지 않기 때문에 수업의 균형을 맞추려고합니다. 한 가지 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.