«python» 태그된 질문

파이썬은 기계 학습에 일반적으로 사용되는 프로그래밍 언어입니다. (a) 'Python'이 질문의 중요한 부분 또는 예상 답변으로 포함되어 있고 (b) 'Python'사용법에 대해 * 일부 *가 아닌 * on-topic * 질문에이 태그를 사용하십시오.

2
임의 포리스트를 사용한 기능 선택
나는 주로 재정적 변수가 많은 데이터 세트 (120 가지 특징, 4k 예제)를 가지고 있으며 상관 관계가 높고 소음이 심합니다 (예 : 기술 지표). 나중에 모델 훈련 (이진 분류)과 함께 사용하기 위해 최대 20-30을 선택하고 싶습니다. - 증가 감소). 기능 순위에 임의 포리스트를 사용하려고 생각했습니다. 재귀 적으로 사용하는 것이 좋습니다? 예를 …

3
멀티 클래스 LDA 교육의 공선 변수
8 클래스 의 데이터 로 다중 클래스 LDA 분류기를 훈련하고 있습니다. 교육을 수행하는 동안 " 변수는 동일 선상에 있습니다 " 라는 경고가 표시됩니다. 90 % 이상의 훈련 정확도를 얻고 있습니다. Python 에서 scikits-learn 라이브러리를 사용 하여 다중 클래스 데이터를 훈련시키고 테스트합니다. 나는 적절한 테스트 정확도도 얻 습니다 (약 85 % …

1
lmer 모델에 사용할 다중 비교 방법 : lsmeans 또는 glht?
하나의 고정 효과 (조건)와 두 개의 임의 효과 (대상 내 설계 및 쌍으로 인해 참가자)가있는 혼합 효과 모델을 사용하여 데이터 세트를 분석하고 있습니다. lme4패키지로 모델이 생성되었습니다 exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). 다음으로, 고정 효과 (조건)없이 모형에 대해이 모형의 우도 비 검정을 수행했으며 유의 한 차이가 있습니다. 내 데이터 세트에는 3 가지 조건이 있으므로 다중 …

3
statsmodel OLS와 scikit 선형 회귀의 차이점
동일한 작업을 수행하는 다른 라이브러리의 두 가지 다른 방법에 대한 질문이 있습니다. 선형 회귀 모델을 만들려고합니다. 다음은 OLS와 함께 statsmodel 라이브러리를 사용하는 코드입니다. X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) results = model.fit() print "GFT + Wiki / GT R-squared", results.rsquared …

2
상자 그림에서 중앙값 대신 평균 표시 [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 3 개월 전 . 파이썬 matplotblib로 boxplot을 플로팅 할 때, 플롯의 중간 선은 분포의 중앙값입니다. 대신 평균 라인을 가질 가능성이 있습니까? 또는 다른 스타일로 옆에 플로팅합니다. 또한 …

3
로지스틱 회귀 분석 : Scikit Learn 및 glmnet
R의 패키지를 sklearn사용하여 로지스틱 회귀 라이브러리 의 결과를 복제하려고합니다 glmnet. 로부터 sklearn로지스틱 회귀 문서 , L2 페널티 아래의 비용 함수를 최소화하기 위해 노력하고있다 minw,c12wTw+C∑i=1Nlog(exp(−yi(XTi승 + C))+1)minw,c12wTw+C∑나는=1엔로그⁡(특급⁡(−와이나는(엑스나는티승+씨))+1)\min_{w,c} \frac12 w^Tw + C\sum_{i=1}^N \log(\exp(-y_i(X_i^Tw+c)) + 1) 로부터 네트 의 glmnet그 구현이 약간 다른 비용 함수를 최소화하는 분β, β0− [ 1엔∑나는 = 1엔와이나는( β0+ …

1
곡선 적합에서 공분산 행렬을 어떻게 해석합니까?
나는 통계가 너무 좋지 않아서 이것이 단순한 질문이라면 사과드립니다. 일부 데이터에 곡선을 맞추고 때로는 내 데이터가 형식으로 음의 지수에 가장 잘 맞으며 때로는 적합이 a * e ( − b * x 2 )에 더 가깝습니다 . + c . 그러나 때로는 둘 다 실패하고 선형 피팅으로 돌아가고 싶습니다. 내 …

3
클러스터링의 데이터 출력을 플롯하는 방법은 무엇입니까?
데이터 세트 (마크 세트)를 클러스터링하려고 시도하고 2 개의 클러스터를 얻었습니다. 그래픽으로 표현하고 싶습니다. (x, y) 좌표가 없기 때문에 표현에 대해 약간 혼란 스럽습니다. 또한 MATLAB / Python 함수를 찾고 있습니다. 편집하다 데이터를 게시하면 질문이 더 명확 해집니다. 파이썬에서 kmeans 클러스터링을 사용하여 만든 두 개의 클러스터가 있습니다 (scipy를 사용하지 않음). 그들은 …


2
"F 회귀"및
피쳐를 F-regression레이블과 개별적으로 상관시키고 값을 관찰하는 것과 동일한 피쳐를 사용하여 피쳐를 비교 합니까?R2R2R^2 나는 종종 동료 F regression들이 다음의 머신 러닝 파이프 라인에서 기능 선택을 위해 사용하는 것을 보았습니다 sklearn. sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` 일부는 말해주십시오-왜 레이블 / 종속 변수와 상관 관계가있는 것과 동일한 결과를 제공합니까? F_regression기능 선택에서 사용하는 이점이 명확하지 않습니다 . …

2
Python의 von Mises-Fisher 배포에서 샘플링?
파이썬에서 다변량 von Mises-Fisher 분포 에서 샘플링하는 간단한 방법을 찾고 있습니다. scipy 및 numpy 모듈 의 통계 모듈을 살펴 보았지만 일 변량 폰 미제스 분포 만 찾았습니다. 사용 가능한 코드가 있습니까? 아직 찾지 못했습니다. 분명히 Wood (1994)는 이 링크 에 따라 vMF 배포에서 샘플링하기위한 알고리즘을 설계 했지만 논문을 찾을 수 …

1
Scipy의 베타 배포 피팅
Wikipedia에 따르면 베타 확률 분포에는 두 가지 모양 매개 변수 와 β가 있습니다.αα\alphaββ\beta [ 0 , 1 ] 범위의 숫자가있는 scipy.stats.beta.fit(x)Python을 호출하면 4 개의 값이 반환됩니다. 이것은 나를 이상하게 생각합니다.x[0,1][0,1][0,1] 인터넷 검색 후 호출하면 세 번째 변수가 0이므로 반환 값 중 하나가 'location'이어야한다는 것을 알았습니다 scipy.stats.beta.fit(x, floc=0). 누구든지 네 번째 …

1
심층 신경망에서의 민감도 분석
이미 한 질문 ( One-Layer 피드 포워드 네트워크에서 가중치 중요성 추출 )에 따라 신경망에서 입력의 관련성에 대한 추론을 찾고 있습니다. 관심있는 출력 노드에서 레이어를 통해 뒤로 이동하여 입력 중요도를 재구성하는 것이 어렵거나 시간이 많이 걸리는 딥 넷을 고려할 때 신경망에 대한 감도 분석을 수행하는 데 이론적 프레임 워크가 있는지 궁금해했습니다. …

1
iloc을 사용하여 값 설정 [닫기]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 2 년 전 . 이 줄은 dataframe에서 처음 4 개 행을 반환 combined에 대한feature_a combined.iloc[0:4]["feature_a"] 예상 한대로이 다음 행은 열의 데이터 프레임에서 두 번째, 네 번째 및 …
13 python  pandas 

2
랜덤 포레스트 모델을 사용할 때 변수를 기록 / 처리하는시기?
여러 속성을 기반으로 가격을 예측하기 위해 Random Forests를 사용하여 회귀를 수행하고 있습니다. 코드는 Scikit-learn을 사용하여 Python으로 작성됩니다. 회귀 모형에 맞도록 변수를 사용 하기 전에 exp/ log를 사용하여 변수를 변환해야하는지 어떻게 결정 합니까? Random Forest와 같은 Ensemble 방식을 사용할 때 필요합니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.