데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

2
케 라스 대 tf. 케 라스
나는 사이의 선택에 혼란 조금 해요 Keras (keras 팀 / keras) 및 tf.keras을 (tensorflow / tensorflow / 파이썬 / keras /) 내 새로운 연구 프로젝트. Keras 가 누구도 소유하지 않는다는 논쟁이 있습니다 . 따라서 사람들이 더 기고하고 프로젝트를 관리하기가 훨씬 쉬워 질 것입니다. ‬ 다른 측면에서, tf.keras은 Google에서 지금보다 엄격한 …

4
Intel GPU와 함께 TensorFlow 사용
나는 딥 러닝의 초보자입니다. Intel GPU와 함께 TensorFlow를 사용할 수있는 방법이 있습니까? 그렇다면 올바른 방향으로 알려주십시오. 그렇지 않은 경우 Intel Corporation Xeon E3-1200 v3 / 4 세대 코어 프로세서 통합 그래픽 컨트롤러에 사용할 수있는 프레임 워크 (Keras, Theano 등)가 있으면 알려주십시오.
20 tensorflow  keras  theano  gpu 

3
데이터 분할 전후의 StandardScaler
사용 StandardScaler에 대해 읽을 때 대부분의 권장 사항은 데이터를 기차 / 테스트로 나누기 StandardScaler 전에 사용해야한다고 말 했지만 온라인으로 게시 된 코드 중 일부 (sklearn을 사용하여)를 확인했을 때 두 가지 주요 용도가있었습니다. 1- StandardScaler모든 데이터를 사용 합니다. 예 : from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_fit = sc.fit(X) X_std …





2
알파 및 베타 하이퍼 파라미터는 Latent Dirichlet 할당에 어떤 영향을 줍니까?
LDA에는 두 개의 하이퍼 파라미터가 있으며이를 조정하면 유도 된 주제가 변경됩니다. 알파 및 베타 하이퍼 파라미터는 LDA에 어떤 영향을 미칩니 까? 하나 또는 다른 하이퍼 파라미터가 증가 또는 감소하면 주제는 어떻게 변경됩니까? 왜 매개 변수뿐만 아니라 하이퍼 파라미터입니까?



3
알 수없는 기능에서 기능 엔지니어링을 수행하는 방법은 무엇입니까?
카글 경쟁에 참여하고 있습니다. 데이터 세트에는 약 100 개의 기능이 있으며 모두 실제로는 무엇을 나타내는 지 알 수 없습니다. 기본적으로 그들은 단지 숫자입니다. 사람들은 이러한 기능에 대해 많은 기능 엔지니어링을 수행하고 있습니다. 정확히 알려지지 않은 기능에 대해 기능 공학을 정확히 수행 할 수있는 방법이 궁금합니다. 알려지지 않은 기능에 대해 기능 …

3
초기 키워드를 기준으로 관련 단어 목록을 늘리는 방법은 무엇입니까?
최근 Google 스프레드 시트에서 사용할 수 있는 멋진 기능을 보았습니다 . "blue", "green", "yellow"와 같은 연속 된 셀에 몇 가지 관련 키워드를 작성하는 것으로 시작하면 유사한 키워드가 자동으로 생성됩니다 (이 경우 다른 색상). 이 YouTube 비디오 에서 더 많은 예제를보십시오 . 내 프로그램에서 이것을 재현하고 싶습니다. Freebase를 사용하려고 생각하고 다음과 …

3
원래 데이터 세트로 학습 한 머신 러닝 모델을 사용하여 합성 데이터 세트를 생성하는 방법은 무엇입니까?
일반적으로 기계 학습 모델은 데이터 세트를 기반으로합니다. 원래의 데이터 셋 특성을 유지하는 훈련 된 머신 러닝 모델을 사용하여 합성 데이터 셋을 생성 할 수있는 방법이 있는지 알고 싶습니다. [원본 데이터-> 기계 학습 모델 구축-> ml 모델을 사용하여 합성 데이터를 생성합니다 .... !!!] 가능합니까? 가능하면 관련 자료를 알려주십시오.

2
텍스트 분류 : 다른 종류의 기능 결합
내가 다루는 문제는 짧은 텍스트를 여러 클래스로 분류하는 것입니다. 내 현재 접근 방식은 tf-idf 가중 항 주파수를 사용하고 간단한 선형 분류기 (로지스틱 회귀)를 배우는 것입니다. 이것은 합리적으로 잘 작동합니다 (테스트 세트에서 약 90 % 매크로 F-1, 훈련 세트에서 거의 100 %). 큰 문제는 보이지 않는 단어 / n- 그램입니다. 분포 …

2
Scikit-learn에서 SVC와 LinearSVC의 차이점을 설명 할 수 있습니까?
나는 최근에 일하는 법을 배우기 시작 sklearn했고이 독특한 결과 를 보았습니다 . 나는 사용 digits가능 데이터 세트 sklearn다른 모델 및 추정 방법을 시도 할 수 있습니다. 데이터에서 Support Vector Machine 모델을 테스트 할 때 sklearnSVM 분류 에 대해 두 가지 다른 클래스가 있음을 발견했습니다 . SVC그리고 LinearSVC전자는 일대일 접근 방식을 …
19 svm  scikit-learn 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.