«python» 태그된 질문

파이썬은 기계 학습에 일반적으로 사용되는 프로그래밍 언어입니다. (a) 'Python'이 질문의 중요한 부분 또는 예상 답변으로 포함되어 있고 (b) 'Python'사용법에 대해 * 일부 *가 아닌 * on-topic * 질문에이 태그를 사용하십시오.


5
기계 학습 문제를 프로토 타이핑하기 위해 어떤 프로그래밍 언어를 권장합니까?
현재 Octave에서 작업하고 있지만 문서화가 좋지 않아 진행 속도가 매우 느립니다. 어떤 언어는 배우고 사용하기 쉽고 기계 학습 문제를 해결하기 위해 잘 문서화되어 있습니까? 작은 데이터 세트 (수천 개의 예제)에서 프로토 타입을 제작하려고하므로 속도는 중요하지 않습니다. 편집 : 추천 엔진을 개발 중입니다. 따라서 정규 선형 회귀, 신경망, SVN 또는 공동 …

5
Numpy에서 효과적으로 가우스 커널을 계산하는 방법 [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 삼년 전에 . m 개의 열과 n 개의 행 이있는 numpy 배열이 있으며 열은 차원과 행 데이터 포인트입니다. 이제 각 데이터 포인트 조합에 대한 커널 값을 계산해야합니다. …

4
매우 높은 차원의 데이터에 대해 PCA를 수행하는 방법은 무엇입니까?
주성분 분석 (PCA)을 수행하려면 데이터에서 각 열의 평균을 빼고 상관 계수 행렬을 계산 한 다음 고유 벡터와 고유 값을 찾아야합니다. 오히려 상관 관계 계수 행렬 (corrcoef)을 찾는 방법으로 높은 차원의 배열을 사용할 수 없기 때문에 작은 행렬에서만 작동한다는 점을 제외하고는 파이썬에서 구현 한 것입니다. 이미지에 이미지를 사용해야하므로 현재 구현이 실제로 …
12 pca  python 

1
(팬더) 자기 상관 그래프는 무엇을 보여줍니까?
나는 초보자이며 자기 상관 그래프가 보여주는 것을 이해하려고합니다. 이 페이지 또는 여기에 인용되지 않은 관련 Wikipedia 페이지 와 같은 다른 출처의 여러 설명을 읽었습니다 . 나는이 매우 간단한 코드를 가지고 있는데, 1 년 동안 색인에 날짜가 있고 각 색인에 대해 값이 단순히 0에서 365로 증가합니다. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365) …

2
Kolmogorov–Smirnov 검정 : 표본 크기가 증가함에 따라 p- 값 및 ks 검정 통계량 감소
표본 크기가 증가함에 따라 p- 값과 ks- 검정 통계가 감소하는 이유는 무엇입니까? 이 Python 코드를 예로 들어 보겠습니다. import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) 결과는 다음과 …

6
비지도 학습에서 기능 선택을 수행하는 R 또는 Python의 메소드 [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 2 년 전 . R / Python에서 데이터에서 중요하지 않은 / 중요한 기능을 삭제 / 선택할 수있는 방법 / 구현 방법은 무엇입니까? 내 데이터에는 라벨이 없습니다 (감독되지 …

8
고차원 데이터 시각화
고차원 공간의 벡터 인 두 클래스의 샘플이 있으며 2D 또는 3D로 플롯하고 싶습니다. 나는 차원 축소 기술에 대해 알고 있지만 matlab, python 또는 미리 작성된 .exe에서 정말 간단하고 사용하기 쉬운 도구가 필요합니다. 또한 2D 표현이 "의미"가 될지 궁금합니다. (예를 들어 두 클래스가 교차하거나 분리 가능한 방법).

1
파이썬에서 scree plot을 그리는 방법은 무엇입니까? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . 행렬에서 특이 벡터 분해를 사용하고 U, S 및 Vt 행렬을 얻고 있습니다. 이 시점에서 유지할 차원 수에 대한 임계 값을 선택하려고합니다. 나는 scree …

2
2D로 다차원 데이터 (LSI) 시각화
나는 문서 간의 유사성을 찾기 위해 잠재 의미 색인을 사용하고 있습니다 ( 감사, JMS를! ) 차원 축소 후에 문서를 클러스터로 그룹화하기 위해 k- 평균 군집화를 시도했지만 매우 효과적입니다. 그러나 조금 더 나아가서 두 노드 사이의 거리가 유사성에 반비례하는 노드 세트로 문서를 시각화하고 싶습니다 (매우 유사한 노드는 서로 가깝습니다). 내 데이터가 …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

4
파이썬의 주성분 분석 및 회귀
SAS에서 수행 한 일부 작업을 Python으로 재현하는 방법을 찾으려고합니다. 다중 공선 성이 문제가되는 이 데이터 세트를 사용하여 Python에서 주요 구성 요소 분석을 수행하고 싶습니다. scikit-learn 및 statsmodels를 살펴 보았지만 출력을 가져 와서 SAS와 동일한 결과 구조로 변환하는 방법을 모르겠습니다. 우선, SAS를 사용할 때 SAS가 상관 관계 매트릭스에서 PCA를 수행하는 것처럼 …

2
퍼셉트론에 대한 결정 경계 플롯
퍼셉트론 알고리즘의 결정 경계를 플롯하려고하는데 실제로 몇 가지 사항에 대해 혼란스러워합니다. 내 입력 인스턴스는 이며 기본적으로 2D 입력 인스턴스 ( x 1 및 x 2 ) 및 이진 클래스 대상 값 ( y ) [1 또는 0]입니다.[(x1,x2),y][(x1,x2),y][(x_{1},x_{2}), y]x1x1x_{1}x2x2x_{2}yyy 내 가중치 벡터는 입니다.[w1,w2][w1,w2][w_{1}, w_{2}] 이제 추가 바이어스 매개 변수 을 통합해야 …

1
Random Forest 회귀 또는 분류자를 선택해야합니까?
임의 포리스트에 의해 이진 대상 클래스가있는 데이터 집합을 맞습니다. 파이썬에서는 randomforestclassifier 또는 randomforestregressor로 할 수 있습니다. randomforestclassifier에서 직접 분류를 가져 오거나 randomforestregressor를 먼저 실행하고 예상 점수 세트 (연속 값)를 다시 가져올 수 있습니다. 그런 다음 점수 세트에서 예측 된 클래스를 도출하기위한 컷오프 값을 찾을 수 있습니다. 두 방법 모두 동일한 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.