«python» 태그된 질문

파이썬은 기계 학습에 일반적으로 사용되는 프로그래밍 언어입니다. (a) 'Python'이 질문의 중요한 부분 또는 예상 답변으로 포함되어 있고 (b) 'Python'사용법에 대해 * 일부 *가 아닌 * on-topic * 질문에이 태그를 사용하십시오.

6
앙상블 방법을 구현하는 방법을 배우기위한 리소스
이론적으로는 (어떻게) 작동하는지 이해하지만 실제로 앙상블 방법을 사용하는 방법 (투표, 가중 혼합물 등)을 잘 모르겠습니다. 앙상블 메소드를 구현하기위한 좋은 리소스는 무엇입니까? 파이썬 구현과 관련된 특정 리소스가 있습니까? 편집하다: 의견에 대한 토론을 기반으로 일부를 정리하기 위해 randomForest 등과 같은 앙상블 알고리즘을 찾고 있지 않습니다. 대신 다른 알고리즘의 다른 분류를 어떻게 결합 …

3
통계 워크 벤치로서의 루비
이것은 또한 매우에 관한 질문 워크 벤치 통계 파이썬 과 통계가 작업대로 엑셀 . Ruby와 Python에 대해 큰 토론이 있다는 것을 알고 있지만 이것이이 질문의 핵심은 아닙니다. 루비가 파이썬보다 빠르며 구문이 매우 자연 스럽기 때문에 통계를 이해하는 데 도움이 될 수 있으며 R에 대한 좋은 대안이 될 수 있다고 생각 …
13 r  python  software  ruby 



1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

2
KMEANS에서 k의 수를 추정하기 위해 BIC 사용
현재 장난감 데이터 세트 (ofc iris (:))의 BIC를 계산하려고합니다. 여기에 표시된 결과를 재현하려고합니다 (그림 5).이 논문은 BIC 공식의 소스이기도합니다. 나는 이것에 2 가지 문제가있다 : 표기법: ninin_i = 클러스터 의 요소 수iii CiCiC_i = 군집 중심 좌표iii xjxjx_j = 클러스터 할당 된 데이터 포인트iii mmm = 클러스터 수 1) 식에서 …

2
Poisson, Gamma 또는 Tweedie 분포를 오류 분포의 패밀리로 사용하여 Python / scikit-learn에서 GLM을 평가할 수 있습니까?
Python과 Sklearn을 배우려고하지만 Poisson, Gamma 및 특히 Tweedie 제품군의 오류 분포를 사용하는 회귀를 실행해야합니다. 나는 그것들에 관한 문서에서 아무것도 보지 못했지만 R 배포판의 여러 부분에 있기 때문에 누군가 파이썬의 구현을 보았는지 궁금합니다. Tweedie 배포판의 SGD 구현으로 나를 가리킬 수 있다면 매우 시원 할 것입니다!

2
칼만 필터를 사용하는 방법?
2D 공간 (표면)에 객체의 궤도가 있습니다. 궤적은 일련의 (x,y)좌표로 제공됩니다. 측정 값이 시끄럽고 때로는 특이 치가 있습니다. 따라서 관측치를 필터링하고 싶습니다. 내가 칼만 필터를 이해하는 한, 내가 필요한 것을 정확하게 수행합니다. 그래서 나는 그것을 사용하려고합니다. 여기 에서 파이썬 구현을 발견했습니다 . 그리고 이것은 문서가 제공하는 예입니다. from pykalman import KalmanFilter …

4
Gradient Descent를 옵티 마이저로 사용하여 학습률을 체계적으로 조정하는 방법은 무엇입니까?
외부 / ML / DL 필드 Tensorflow를 기반으로 Udacity Deep Learning 과정을 시작했습니다. 과제 3 문제 4 수행; 다음 구성으로 학습 속도를 조정하려고합니다. 배치 크기 128 걸음 수 : 2 개의 에포크를 채우기에 충분 숨겨진 레이어의 크기 : 1024, 305, 75 가중치 초기화 : 표준에서 잘림 sqrt (2 / n)의 …

1
파이썬에서 순서 형 로지스틱 회귀
세 가지 수준과 설명 요소가있는 반응 변수에 대해 파이썬에서 순서 형 로지스틱 회귀를 실행하고 싶습니다. 이 statsmodels패키지는 이진 로짓 및 다항 로짓 (MNLogit) 모델을 지원하지만 순서가 지정된로 짓은 지원하지 않습니다. 기본 수학이 다르지 않기 때문에 이것을 사용하여 쉽게 구현할 수 있는지 궁금합니다. (또는 작동하는 다른 Python 패키지도 높이 평가됩니다.)

1
MCMC에서 자기 상관 플롯을 해석하는 방법
나는 "강아지 책"이라고도 알려진 John K. Kruschke의 Doing Bayesian Data Analysis 책을 읽음으로써 베이지안 통계에 익숙해 졌다. 9 장에서는 계층 모델이 간단한 예 도입 및 베르누이 관측치는 3 개의 동전이며, 각각 10 회 뒤집습니다. 하나는 9 헤드, 다른 하나는 5 헤드 및 다른 하나는 1 헤드를 보여줍니다.와이j 나는θ제이μκ~ B e …

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
이 분포가 왜 균일합니까?
우리는 베이지안 통계 테스트를 조사하고 있으며 이상한 현상을 겪고 있습니다. 다음과 같은 경우를 고려하십시오. A 또는 B 인구가 ​​어느 전환율이 더 높은지 측정하는 데 관심이 있습니다. 온 전성 검사의 경우 설정합니다 . 즉, 변환 확률이 두 그룹에서 동일합니다. 이항 모델을 사용하여 인공 데이터를 생성합니다. 예 :pA=pBpA=pBp_A = p_BnA∼Binomial(N,pA)nA∼Binomial(N,pA)n_A \sim \text{Binomial}(N, …

1
가우스 혼합 모델 (GMM) 작업을위한 Python 패키지
파이썬에서 Gaussian Mixture Models (GMMs) 작업에 사용할 수있는 몇 가지 옵션이있는 것 같습니다. 언뜻보기에는 최소한 : PyMix- http: //www.pymix.org/pymix/index.php 혼합물 모델링 도구 - PyEM http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/ Scipy 도구 상자의 일부이며 GMM에에 초점을 맞출 것으로 보인다 지금으로 알려진 : 업데이트 sklearn.mixture . PyPR- http: //pypr.sourceforge.net/ 패턴 인식 및 GMM을 포함한 관련 도구 …

1
Scikit predict_proba 출력 해석
파이썬에서 scikit-learn 라이브러리를 사용하고 있습니다. 아래 코드에서 확률을 예측하고 있지만 출력을 읽는 방법을 모르겠습니다. 테스트 데이터 from sklearn.ensemble import RandomForestClassifier as RF from sklearn import cross_validation X = np.array([[5,5,5,5],[10,10,10,10],[1,1,1,1],[6,6,6,6],[13,13,13,13],[2,2,2,2]]) y = np.array([0,1,1,0,1,2]) 데이터 세트 나누기 X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.5, random_state=0) 확률 계산 clf = RF() clf.fit(X_train,y_train) …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.