«python» 태그된 질문

파이썬은 기계 학습에 일반적으로 사용되는 프로그래밍 언어입니다. (a) 'Python'이 질문의 중요한 부분 또는 예상 답변으로 포함되어 있고 (b) 'Python'사용법에 대해 * 일부 *가 아닌 * on-topic * 질문에이 태그를 사용하십시오.

2
다중 레이블 분류기에서 scikit-learn의 교차 검증 기능을 사용하는 방법
5 개의 클래스가 있고 각 인스턴스가 하나 이상의 클래스에 속할 수있는 데이터 세트에서 다른 분류자를 테스트하고 있으므로 특히 scikit-learn의 다중 레이블 분류기를 사용하고 있습니다 sklearn.multiclass.OneVsRestClassifier. 이제를 사용하여 교차 유효성 검사를 수행하고 싶습니다 sklearn.cross_validation.StratifiedKFold. 다음과 같은 오류가 발생합니다. Traceback (most recent call last): File "mlfromcsv.py", line 93, in <module> main() File …

2
파이썬 matplotlib boxplot에서 진드기 이름을 지정하는 방법
잠김 . 이 질문과 주제는 주제가 다르지만 역사적 의미가 있기 때문에이 질문과 답변은 잠겨 있습니다. 현재 새로운 답변이나 상호 작용을받지 않습니다. 파이썬 matplotlib 에는 boxplot 명령이 있습니다. 일반적으로 그래프의 모든 부분이 숫자로 표시됩니다. 진드기를 위치 대신 이름으로 바꾸려면 어떻게해야합니까? 예를 들어,이 상자 그림과 같은 Mon Tue Wed 레이블을 의미합니다.

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
상관 행렬 클러스터링
모든 항목이 다른 항목과 어떻게 관련되는지를 나타내는 상관 관계 매트릭스가 있습니다. 따라서 N 항목의 경우 이미 N * N 상관 행렬이 있습니다. 이 상관 관계 매트릭스를 사용하여 k 번째 빈의 Nk 항목이 동일하게 작동하도록 M 빈의 N 항목을 클러스터링하는 방법은 무엇입니까? 친절하게 도와주세요. 모든 항목 값은 범주 형입니다. 감사. 더 …

1
선형 회귀 분석에서 순환 예측 변수 사용
바람 데이터 (0, 359)와 시간 (0, 23)을 사용하여 모델을 적합하려고하지만 선형 매개 변수가 아니기 때문에 선형 회귀에 적합하지 않을까 걱정됩니다. 파이썬을 사용하여 변환하고 싶습니다. 적어도 바람의 경우에는 그 정도의 죄와 코사인을 취함으로써 벡터 평균을 계산하는 것에 대한 언급이 있지만 전부는 아닙니다. 도움이 될만한 파이썬 라이브러리 또는 관련 방법이 있습니까?

3
시계열 벡터 예측을 위해 RNN (LSTM) 사용 (Theano)
나는 매우 간단한 문제가 있지만 그것을 해결할 수있는 올바른 도구를 찾을 수 없습니다. 길이가 같은 벡터 시퀀스가 ​​있습니다. 이제이 시퀀스의 기차 샘플에 대해 LSTM RNN을 학습 한 다음 여러 프라이밍 벡터를 기반으로 길이 의 새로운 벡터 시퀀스를 예측하려고합니다 .엔엔n 이 작업을 수행하는 간단한 구현을 찾을 수 없습니다. 내 기본 언어는 …

3
줄리아 : 어떻게 지내고 있는지 재고
이 게시물은 빠르게 변화하는 이벤트와 관련이 있습니다. 나는 다양한 유형의 통계 작업에 대한 R / Python의 대안으로 Julia에 대해 매우 좋은 토론을 한 2012 년 질문을 보았습니다. 여기 Julia의 약속에 관한 2012 년의 원래 질문이 있습니다. 불행히도 Julia는 당시 매우 새롭고 통계 작업에 필요한 툴킷은 다소 원시적이었습니다. 버그가 해결되었습니다. 배포판을 …
19 r  python  computing  julia 

3
통계적으로 유의미한 데이터를 시뮬레이션하는 방법은 무엇입니까?
저는 10 학년이며 기계 학습 과학 박람회 프로젝트의 데이터를 시뮬레이션하려고합니다. 최종 모델은 환자 데이터에 사용되며 주중 특정 시간과 이것이 단일 환자의 데이터 내에서 약물 준수에 미치는 영향을 예측합니다. 준수 값은 이진수입니다 (0은 약을 복용하지 않았 음을 의미하고 1은 복용 함을 의미 함). 요일 간의 관계를 통해 학습 할 수있는 기계 …

3
로지스틱 회귀 계수의 표준 오차를 계산하는 방법
파이썬의 scikit-learn을 사용하여 로지스틱 회귀를 훈련하고 테스트합니다. scikit-learn은 독립 변수의 회귀 계수를 반환하지만 계수의 표준 오차는 제공하지 않습니다. 각 계수에 대한 Wald 통계량을 계산하고 이러한 계수를 서로 비교하려면 이러한 표준 오류가 필요합니다. 로지스틱 회귀 계수 ( here ) 의 표준 오차를 계산하는 방법에 대한 설명을 찾았 지만 따르기가 다소 어렵습니다. …

2
시계열 예측을 자동화 할 수 있습니까?
모든 시계열을 분석하고 분석 된 시계열 데이터에 가장 적합한 기존 / 통계 예측 방법 (및 해당 매개 변수)을 "자동"으로 선택할 수있는 알고리즘을 만들고 싶습니다. 이런 식으로 할 수 있습니까? 그렇다면 어떻게 접근 할 수 있는지 몇 가지 팁을 주시겠습니까?

3
파이썬에서 공선 변수를 체계적으로 제거하는 방법은 무엇입니까? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 2 년 전 . 지금까지 상관 테이블을보고 특정 임계 값을 초과하는 변수를 제거하여 데이터 준비 프로세스의 일부로 공선 변수를 제거했습니다. 이 작업을 수행하는 데 더 허용되는 방법이 …

3
N 성공까지 어떻게 플립을 모델링 할 수 있습니까?
당신과 저는 동전을 뒤집는 게임을하기로 결정했습니다. 총 10 헤드를 뒤집은 첫 번째 플레이어가 게임에서 승리합니다. 당연히 누가 먼저 가야하는지에 대한 논쟁이 있습니다. 이 게임의 시뮬레이션에 따르면 첫 번째로 뒤집는 플레이어는 두 번째로 뒤집는 플레이어보다 6 % 더 많이 이깁니다 (첫 번째 플레이어는 약 53 %의 시간을 이깁니다). 나는 이것을 분석적으로 …


1
Python의 Jenks Natural Breaks : 최적의 휴식 수를 찾는 방법은 무엇입니까?
Jenks Natural Breaks 알고리즘 의이 Python 구현 을 발견 했으며 Windows 7 컴퓨터에서 실행할 수 있습니다. 꽤 빠르며 지리 데이터의 크기를 고려하여 몇 시간 만에 중단 점을 찾습니다. 내 데이터에이 클러스터링 알고리즘을 사용하기 전에 (여기) 알고리즘을 사용하고있었습니다. KMeans와 관련된 문제는 최적의 K 값 매개 변수를 찾는 것이었지만 다른 K 값에 …

1
다중 선형 회귀 분석에서 예측 된 점의 플롯이 직선에 있지 않은 이유는 무엇입니까?
Y와 X1, X2 사이의 관계를 설명하기 위해 다중 선형 회귀를 사용하고 있습니다. 이론으로부터 나는 다중 회귀가 Y와 X 각각 (Y와 X1, Y와 X2) 사이의 선형 관계를 가정한다는 것을 이해했습니다. X 변환을 사용하지 않습니다. 따라서 R = 0.45 및 모든 중요 X (P <0.05)의 모델을 얻었습니다. 그런 다음 X1에 대해 Y를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.