«python» 태그된 질문

파이썬은 기계 학습에 일반적으로 사용되는 프로그래밍 언어입니다. (a) 'Python'이 질문의 중요한 부분 또는 예상 답변으로 포함되어 있고 (b) 'Python'사용법에 대해 * 일부 *가 아닌 * on-topic * 질문에이 태그를 사용하십시오.

2
중첩 교차 검증의 구현
중첩 교차 유효성 검사에 대한 이해가 올바른지 알아 내려고 노력하고 있으므로이 장난감 예제를 작성하여 내가 옳은지 확인했습니다. import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import load_boston # set random state state = 1 # load boston dataset boston = load_boston() X …

3
파이썬을 이용한 시계열 이상 탐지
여러 시계열 데이터 세트에서 이상 감지를 구현해야합니다. 나는 전에 이것을 한 적이 없으며 조언을 기대하고있었습니다. 나는 파이썬에 매우 익숙하므로 솔루션을 구현하는 것을 선호합니다 (대부분의 코드는 내 작업의 다른 부분에 대한 파이썬입니다). 데이터 설명 : 지난 2 년 정도 전에 수집 된 월별 시계열 데이터입니다 (즉, 24-36 시간 만). 기본적으로 여러 …

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


1
아이들은 어떻게 GWAS 데이터 세트의 PCA 프로젝션에서 부모를 어떻게 함께 모을 수 있습니까?
에서 각 좌표 iid로 10,000 차원 공간에서 20 개의 임의의 점을 취합니다 . 10 쌍 ( "커플")으로 나누고 각 쌍의 평균 ( "자식")을 데이터 세트에 추가하십시오. 그런 다음 결과 30 점에서 PCA를 수행하고 PC1 대 PC2를 플로팅합니다.엔( 0 , 1 )N(0,1)\mathcal N(0,1) 놀라운 일이 일어납니다. 각 "가족"은 서로 가까이있는 삼중점을 …

1
수학적 이론으로부터 "경사 균일 분포"로부터 난수 생성
어떤 목적을 위해, "경사 균일 한"분포로부터 난수 (데이터)를 생성해야합니다. 이 분포의 "기울기"는 적절한 간격으로 다를 수 있으며,이 분포에 따라 경사도에 따라 분포가 균일에서 삼각형으로 변경되어야합니다. 여기 내 파생물이 있습니다. 간단하게 만들고 에서 까지의 데이터 형식을 생성합시다 (파란색, 빨간색은 균일 분포). 파란색 선의 확률 밀도 함수를 구하려면 해당 선의 방정식 만 …

2
분류 된 퍼널을 어떻게 시각화 하시겠습니까? (그리고 파이썬으로 할 수 있습니까?)
Moz 에서이 게시물 을 보고 세그먼트 마케팅 퍼널을 제시했습니다. 이런 종류의 일은 내 직업에서 상당히 가치가 있습니다. 내가 모르는 것은 원시 데이터를 시각화하여 이와 같은 세그먼트 퍼널을 표시하는 방법입니다. 아이디어는 영업 리드가 서로 다른 소스 (데이터를 분류하는 데 사용)에서 나오고 거래로 전환 될 때마다 여러 단계를 거치는 것입니다. 각 단계에서 …

1
Scikit Learn의 군집 관성 수식
팬더와 scikit learn을 사용하여 파이썬으로 kmeans 클러스터링을 코딩하고 싶습니다. 좋은 k를 선택하기 위해 Tibshirani와 al 2001 ( pdf ) 의 Gap Statistic을 코딩하고 싶습니다 . scikit의 inertia_ 결과 를 사용 하고 모든 거리 계산을 다시 코딩하지 않고도 갭 통계 공식을 조정할 수 있는지 알고 싶습니다 . scikit에 사용 된 관성 …

2
회귀를 맞추는 방법
측정 된 변수가 이산 양수 (수) 인 시계열 데이터가 있습니다. 시간이 지남에 따라 상승 추세가 있는지 테스트하고 싶습니다. 독립 변수 (x)는 0-500 범위에 있고 종속 변수 (y)는 0-8 범위에 있습니다. 나는 y = floor(a*x + b)보통 최소 제곱 (OLS)을 사용 하여 형태의 회귀를 피팅함으로써 이것에 대답한다고 생각했습니다 . R (또는 …
9 r  regression  python 

2
일련의 셀 신호 데이터에서 피크 평가
셀 신호 측정에서 응답의 존재를 측정하고 있습니다. 내가 한 것은 먼저 시계열 데이터에 평활 알고리즘 (Hanning)을 적용 한 다음 피크를 감지했습니다. 내가 얻는 것은 이것입니다 : 응답 감지를 "예를 들어 연속 하락이 증가하는 것"보다 좀 더 객관적으로 만들고 싶다면 최선의 방법은 무엇입니까? 선형 회귀에 의해 결정된 기준선으로부터 피크의 거리를 얻는 …

5
정규 분포의 백분위 수 계산
이 위키 백과 페이지를 참조하십시오. http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval Agresti-Coull Interval을 얻으려면 라는 정규 분포의 백분위 수를 계산해야합니다 . 백분위 수는 어떻게 계산합니까? Wolfram Mathematica 및 / 또는 Python / NumPy / SciPy에서이를 수행하는 기성품 기능이 있습니까?지zz

1
Naive Bayes와 Recurrent Neural Network (LSTM)의 차이점
텍스트에 대한 감정 분석을 수행하고 여러 기사를 살펴보고 일부는 "Naive Bayes"를 사용 하고 다른 일부는 "Recurrent Neural Network (LSTM)"입니다 . 반면에 감정 분석을위한 Python 라이브러리를 보았습니다. NLTK입니다. 그것은 사용 "나이브 베이 즈 ' 깡통 사람이 두 가지를 사용 사이의 차이점은 무엇입니까 설명? 나는 또한이 게시물을 겪었지만 두 가지에 대해서는 명확하지 …

2
이 데이터 집합에 공분산이없는 이유는 무엇입니까?
공분산의 작동 방식에 대한 이해는 상관 관계가있는 데이터의 공분산이 다소 높아야한다는 것입니다. 산점도에 표시된 것처럼 데이터가 상관 관계가 있지만 공분산이 거의 0에 가까운 상황을 겪었습니다. 상관 관계가있는 데이터의 공분산은 어떻게 0이 될 수 있습니까? import numpy as np x1 = np.array([ 0.03551153, 0.01656052, 0.03344669, 0.02551755, 0.02344788, 0.02904475, 0.03334179, 0.02683399, 0.02966126, …

1
'맥주와 기저귀'상관 관계 분석을 수행하는 방법
다음과 동등한 데이터가 있습니다. shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... 이 데이터 세트에 대한 분석을 수행하여 다음과 유사한 상관 관계 매트릭스를 얻을 수 있습니다. x를 구입하면 y를 구입할 가능성이 높습니다. 파이썬 (또는 아마도 MATLAB 이외의 것을 사용)을 사용하면 어떻게 할 수 있습니까? 몇 가지 기본 지침 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.