데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

3
선형 회귀 분석에서 가중치를 음이 아닌 값으로 만드는 방법
파이썬에서 scikit-learn을 사용하여 표준 선형 회귀를 사용하고 있습니다. 그러나 가중치가 모든 기능 (음수가 아님)에 대해 모두 긍정적이되도록하고 싶습니다. 그것을 달성 할 수있는 방법이 있습니까? 나는 문서를보고 있었지만 그것을 달성 할 수있는 방법을 찾지 못했습니다. 나는 최선의 해결책을 얻지 못할 수도 있음을 이해하지만, 음이 아닌 가중치가 필요합니다.

7
기계 학습 모델을 훈련시키는 무료 클라우드 서비스가 있습니까?
많은 양의 교육 데이터로 심층 모델을 학습하고 싶지만 데스크톱에는 이러한 풍부한 데이터로 심층 모델을 교육 할 수있는 기능이 없습니다. 기계 학습 및 딥 러닝 모델을 교육하는 데 사용할 수있는 무료 클라우드 서비스가 있는지 알고 싶습니다. 또한 교육 결과를 추적 할 수있는 클라우드 서비스가 있는지 알고 싶습니다. 클라우드에 연결되어 있지 않아도 …


7
다른 컴퓨터에서 Python 작업 환경을 복제하는 방법?
내 워크 스테이션에서 Python (Anaconda + Flask)을 사용한 기계 학습 모델을 개발했으며 모든 것이 잘 진행됩니다. 나중에이 프로그램을 다른 컴퓨터에 제공하려고했지만 동일한 환경을 설정하려고했지만 프로그램이 실행되지 않습니다. 프로그램을 원활하게 실행되는 다른 컴퓨터로 프로그램을 복사했습니다. 실패한 경우의 문제를 파악할 수 없습니다 (프로그램 코드와 오류 메시지가 풍부하므로 여기에 제시 할 수 없습니다).하지만 …
26 python  anaconda 

7
기계 학습이 목록에서 최대 값을 찾는 것과 같은 기능을 배울 수 있습니까?
나는 목록 인 입력을 가지고 있으며 출력은 입력 목록의 요소의 최대 값입니다. 기계 학습은 항상 입력에 존재하는 최대 입력 요소를 선택하는 기능을 배울 수 있습니까? 이것은 매우 기본적인 질문처럼 보이지만 기계 학습이 일반적으로 할 수있는 일에 대한 이해를 줄 수 있습니다. 감사!

1
PyTorch와 Tensorflow Fold
두 PyTorch 및 Tensorflow은 접어 입력 데이터가 균일하지 않은 길이나 크기가 상황입니다 (동적 그래프가 유용하거나 필요하지 않은 상황)을 처리하는 의미 깊은 학습 프레임 워크입니다. 나는 그들이 의존하는 패러다임의 의미 (예 : 동적 배치)와 그 의미, 각각에 구현 할 수없는 것, 약점 / 강점 등을 비교하는 방법을 알고 싶습니다. 이 정보를 …

1
Keras는 정확도를 어떻게 계산합니까?
Keras는 클래스 별 확률에서 정확도를 어떻게 계산합니까? 예를 들어 테스트 세트에 두 개의 클래스 중 하나에 속할 수있는 100 개의 샘플이 있습니다. 우리는 또한 계급의 영아 목록을 가지고 있습니다. Keras는 두 클래스 중 하나에 샘플을 할당하기 위해 어떤 임계 값을 사용합니까?

4
데이터 과학의 "과학"에 관한 책? [닫은]
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 데이터 과학의 과학과 수학에 관한 책은 무엇입니까? 너무 많은 "데이터 과학"책은 프로그래밍 튜토리얼이며 데이터 생성 프로세스 및 통계적 …

7
공개적으로 사용 가능한 소셜 네트워크 데이터 세트 / API
공개적으로 사용 가능한 데이터 세트 목록을 확장하여 공개적으로 사용 가능한 소셜 네트워크 데이터 세트 / 크롤링 API 목록이 있는지 알고 싶습니다. 데이터 세트 / API에 대한 링크와 함께 사용 가능한 데이터의 특성이 추가되면 매우 좋습니다. 이러한 정보는 다음과 같아야하며 이에 국한되지 않습니다. 소셜 네트워크의 이름; 어떤 종류의 사용자 정보 (게시물, …

2
batch_size, steps_per epoch 및 유효성 검사 단계를 설정하는 방법
Keras를 사용하여 CNN을 배우기 시작했습니다. Theano 백엔드를 사용하고 있습니다. 값을 설정하는 방법을 이해하지 못합니다. batch_size, 에포크 당 단계, validation_steps. batch_size트레이닝 세트에 240,000 개의 샘플이 있고 테스트 세트에 80,000 개의 샘플이있는 경우 값 은 에포크 당 단계 및 검증 단계로 설정되어야합니까?

6
원하는 Facebook 사이트를 기반으로 사용자의 나이를 추정하기위한 기계 학습 기술
Facebook 응용 프로그램의 데이터베이스가 있으며 머신 러닝을 사용하여 Facebook 사이트의 선호도에 따라 사용자의 나이를 추정하려고합니다. 내 데이터베이스에는 세 가지 중요한 특성이 있습니다. 내 훈련 세트의 연령 분포 (총 사용자 수 12k)는 더 젊은 사용자 (예 : 27 세의 1157 명의 사용자와 65 세의 23 명의 사용자)로 비뚤어져 있습니다. 많은 사이트는 …

2
LightGBM 및 XGBoost
어느 것이 더 나은지 이해하려고합니다 (특히 분류 문제에서 더 정확합니다) LightGBM과 XGBoost를 비교하는 기사를 검색했지만 두 가지만 발견했습니다. https://medium.com/implodinggradients/benchmarking-lightgbm-how-fast-is-lightgbm-vs-xgboost-15d224568031- 속도에 관한 것이지만 정확성은 아닙니다. https://github.com/Microsoft/LightGBM/wiki/Experiments-LightGBM 의 저자가 제공 한 것으로 LightGBM이이기는 것은 놀라운 일이 아닙니다. 내 테스트에서 두 알고리즘에 대해 거의 동일한 AUC를 얻지 만 LightGBM은 2-5 배 빠르게 실행됩니다. …
25 xgboost 

2
Keras에서 두 가지 모델 병합
두 Keras 모델을 단일 모델로 병합하려고 하는데이 작업을 수행 할 수 없습니다. 예를 들어 첨부 된 그림에서 치수 8 의 중간 레이어 를 가져 와서 모델 B 의 레이어 B 1 (차원 8의 입력)에 대한 입력으로 사용 하고 모델 A 와 모델 B 를 모두 단일 모델.A2A2A2B1B1B1BBBAAABBB 기능 모듈을 사용하여 …

4
pandas.DataFrame.isin을 병렬로 실행하는 간단한 방법이 있습니까?
DataFrame.isin팬더 의 기능을 많이 사용하는 모델링 및 스코어링 프로그램을 사용하여 수천 명의 특정 페이지 각각에 대해 개별 사용자의 페이스 북 "유사한"레코드 목록을 검색합니다. 이는 모델링 또는 스코어링 조각보다 프로그램에서 가장 시간이 많이 걸리는 부분입니다. 단순히 하나의 코어에서만 실행되고 나머지는 수십 개에서 동시에 실행되기 때문입니다. 수동으로 데이터 프레임을 청크로 분할하고 작업을 …

5
신경망에서 뉴런과 레이어 수를 설정하는 방법
나는 신경망의 초보자이며 두 가지 개념을 이해하는 데 어려움을 겪었습니다. 주어진 신경망이 갖는 중간 계층의 수를 어떻게 결정합니까? 1 대 10 또는 무엇이든. 각 중간 층의 뉴런 수를 어떻게 결정합니까? 각 중간 층에 동일한 수의 뉴런을 갖는 것이 권장됩니까, 아니면 응용에 따라 다릅니 까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.