«python» 태그된 질문

파이썬은 기계 학습에 일반적으로 사용되는 프로그래밍 언어입니다. (a) 'Python'이 질문의 중요한 부분 또는 예상 답변으로 포함되어 있고 (b) 'Python'사용법에 대해 * 일부 *가 아닌 * on-topic * 질문에이 태그를 사용하십시오.

25
통계 워크 벤치로서의 파이썬
많은 사람들이 통계 요구에 Excel 또는 다른 스프레드 시트, SPSS, Stata 또는 R과 같은 기본 도구를 사용합니다. 매우 특별한 요구를 위해 특정 패키지로 전환 할 수 있지만 간단한 스프레드 시트 또는 일반 통계 패키지 또는 통계 프로그래밍 환경을 사용하여 많은 작업을 수행 할 수 있습니다. 저는 항상 파이썬을 프로그래밍 언어로 …
355 r  spss  stata  python 

4
신경망에서 배치 크기는 무엇입니까?
Python Keras package신경망에 사용 하고 있습니다. 이것은 링크 입니다. IS는 batch_size테스트 샘플의 수와 같다? Wikipedia에서 우리는 다음 정보를 가지고 있습니다 : 그러나, 다른 경우에, 합-그라디언트를 평가하기 위해서는 모든 서 맨드 함수로부터의 구배에 대한 고가의 평가가 필요할 수있다. 트레이닝 세트가 거대하고 간단한 공식이 존재하지 않으면, 그라디언트를 평가하는 것은 모든 summand 함수의 …

2
신경망에서 임베딩 레이어는 무엇입니까?
많은 신경망 라이브러리에는 Keras 또는 Lasagne 와 같은 '임베딩 레이어'가 있습니다. 설명서를 읽었음에도 그 기능을 이해하고 있는지 잘 모르겠습니다. 예를 들어, Keras 문서에서 다음과 같이 말합니다. 양의 정수 (인덱스)를 고정 크기의 밀도 벡터로 변환합니다 (예 : [[4], [20]]-> [[0.25, 0.1], [0.6, -0.2]] 지식이 풍부한 사람이 자신이하는 일과 사용시기를 설명 할 …

3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

9
시계열에서 이상을 탐지하기 위해 어떤 알고리즘을 사용해야합니까?
배경 Network Operations Center에서 일하고 있으며 컴퓨터 시스템 및 성능을 모니터링합니다. 모니터링 할 주요 지표 중 하나는 현재 서버에 연결된 많은 방문자 / 고객입니다. 이를 보이기 위해 (Ops 팀) 시계열 데이터와 같은 메트릭을 수집하고 그래프를 그립니다. Graphite 는 우리가 그것을 할 수있게 해줍니다.이 API는 갑작스런 하락 (주로) 및 기타 변경이 …

1
교차 검증, 학습 곡선 및 최종 평가를 위해 데이터 세트를 분할하는 방법은 무엇입니까?
데이터 세트를 분할하기위한 적절한 전략은 무엇입니까? 나는 다음과 같은 접근 방식에 대한 피드백을 요청 (안 같은 개별 매개 변수에 대한 test_size또는 n_iter,하지만 내가 사용하는 경우 X, y, X_train, y_train, X_test, 그리고 y_test적절하고 순서가 의미가있는 경우) : ( scikit-learn 문서 에서이 예제를 확장 ) 1. 데이터 셋로드 from sklearn.datasets import load_digits …

5
신경망에서 다중 등급, 다중 라벨 분류 작업에 어떤 손실 기능이 있습니까?
객체 집합을 n 클래스로 분류하기 위해 신경망을 훈련하고 있습니다. 각 객체는 동시에 여러 클래스에 속할 수 있습니다 (멀티 클래스, 멀티 레이블). 다중 클래스 문제의 경우 일반적으로 mse 대신 손실 함수로 softmax 및 categorical cross entropy를 사용하는 것이 좋습니다. 나는 그 이유를 다소 이해합니다. 다중 레이블에 대한 문제의 경우 각 클래스 …

9
데이터 과학에서 R과 Python은 어떻게 서로를 보완합니까?
많은 튜토리얼이나 매뉴얼에서 서술은 R과 파이썬이 분석 프로세스의 보완 구성 요소로 공존한다는 것을 암시하는 것으로 보입니다. 그러나 훈련받지 않은 눈에는 두 언어가 똑같은 일을하는 것처럼 보입니다. 내 질문은 두 언어에 대한 전문화 된 틈새가 있는지 아니면 하나를 사용할 것인지 개인적으로 선호하는 것입니까?
54 r  python  software 

10
파이썬을 이용한 머신 러닝
기계 학습 실험을 위해 Python 라이브러리 사용을 고려하고 있습니다. 지금까지 WEKA에 의존하고 있었지만 전반적으로 불만족 스러웠습니다. WEKA가 제대로 지원되지 않는 것으로 나타났습니다 (예를 들어, 문서가 드물고 커뮤니티 지원이 내 경험에서 바람직하지 않습니다). 내가이 움직임을 생각하고있는 또 다른 이유는 내가 정말로 파이썬을 좋아하고 (파이썬에 익숙하지 않다) Java에서 코딩으로 돌아가고 싶지 않기 …


5
SVM 기능 가중치를 어떻게 해석합니까?
선형 SVM을 피팅하여 주어진 가변 가중치를 해석하려고합니다. (나는 scikit-learn 사용하고 있습니다 ) : from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ 설명서에서 이러한 가중치를 계산하거나 해석하는 방법을 구체적으로 나타내는 내용을 찾을 수 없습니다. 체중의 표시는 수업과 관련이 있습니까?

2
팬더 / Statsmodel / Scikit-learn
Pandas, Statsmodels 및 Scikit-learn은 기계 학습 / 통계 작업의 다른 구현입니까? 아니면 서로 보완 적인가? 다음 중 가장 포괄적 인 기능이있는 것은 무엇입니까? 어느 것이 적극적으로 개발 및 / 또는 지원됩니까? 로지스틱 회귀를 구현해야합니다. 이 중 어떤 것을 사용해야하는지에 대한 제안이 있습니까?

6
100 % 정확도 결정 트리를 얻는 이유는 무엇입니까?
의사 결정 트리의 정확도가 100 %입니다. 내가 무엇을 잘못하고 있지? 이것은 내 코드입니다. import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test = x[0:658] y_train …

4
데이터에는 두 가지 추세가 있습니다. 독립적 인 추세선을 추출하는 방법?
특정 방식으로 정렬되지 않은 데이터 세트가 있지만 명확하게 표시되면 두 가지 뚜렷한 경향이 있습니다. 간단한 선형 회귀 분석은 두 계열 사이의 명확한 구분 때문에 실제로는 적합하지 않습니다. 두 개의 독립적 인 선형 추세선을 얻는 간단한 방법이 있습니까? 레코드를 위해 파이썬을 사용하고 있으며 기계 학습을 포함하여 프로그래밍 및 데이터 분석에 상당히 …

1
임시 네트워크에서 링크 이상 탐지
나는 트랜드 주제를 예측하기 위해 링크 이상 감지를 사용하는이 논문을 발견했으며,이 논문은 "링크 이상 감지를 통해 소셜 스트림에서 신흥 주제 발견" 이라는 놀라운 흥미를 발견했다 . 다른 데이터 세트에 복제하고 싶지만 사용 방법을 알 수있는 방법에 익숙하지 않습니다. 6 개월 동안 일련의 노드 네트워크에 대한 스냅 샷이 있다고 가정 해 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.