«tools» 태그된 질문

8
인터넷 회사는 왜 데이터 과학자 직업에 Java / Python을 선호합니까?
데이터 과학자가 Python / Java 경험을 요구하고 R을 무시하는 작업 설명에서 여러 번 보았습니다. 아래는 링크 인을 통해 신청 한 회사의 수석 데이터 과학자로부터받은 개인 이메일입니다. X, 연결하고 관심을 가져 주셔서 감사합니다. 당신은 좋은 분석 기술이 있습니다. 그러나 인터넷 / 모바일 조직이므로 모든 데이터 과학자는 Java / Python에서 우수한 프로그래밍 …

9
Python을 사용하여 재현 가능한 데이터 과학을위한 도구 및 프로토콜
Python을 사용하여 데이터 과학 프로젝트를 진행하고 있습니다. 이 프로젝트에는 여러 단계가 있습니다. 각 단계는 Python 스크립트, 보조 데이터, 구성 및 매개 변수를 사용하고 다른 데이터 세트를 작성하는 데이터 세트로 구성됩니다. 코드를 git에 저장하므로 해당 부분을 다룹니다. 다음에 대해 듣고 싶습니다 : 데이터 버전 관리 도구. 무대와 실험을 재현 할 수있는 …

9
R 프로그래밍을위한 IDE 대안 (RStudio, IntelliJ IDEA, Eclipse, Visual Studio)
R 프로그래밍에 RStudio를 사용합니다. Visual Studio 또는 Eclipse와 같은 다른 기술 스택의 견고한 IDE에 대해 기억합니다. 두 가지 질문이 있습니다. RStudio 이외의 다른 IDE가 사용되는 것 (간단한 설명을 고려하십시오). RStudio보다 눈에 띄는 장점이 있습니까? 필자는 코딩 자체 외에도 디버그 / 빌드 / 배포 기능을 주로 의미합니다 (따라서 텍스트 편집기는 해결책이 …
45 r  tools  rstudio  programming 

11
데이터 과학자들이 Excel을 사용합니까?
나는 나 자신을 여행가 데이터 과학자라고 생각할 것이다. 대부분의 (제 생각에), 저는 첫 차트를 만들었고 Excel을 사용하여 고등학교와 대학에서 첫 집계를했습니다. 대학, 대학원, 7 년 간의 업무 경험을 통해 SQL, R, Python, Hadoop, LaTeX 등과 같은 고급 도구로 간주되는 것을 빠르게 선택했습니다. 우리는 데이터 과학자 직책에 대해 인터뷰하고 있으며 한 …
37 tools  career  excel 

5
데이터 과학 프로젝트를위한 VM 이미지
데이터 과학 작업에 사용할 수있는 수많은 도구가 있으므로 모든 것을 설치하고 완벽한 시스템을 구축하는 것은 번거 롭습니다. Python, R 및 기타 오픈 소스 데이터 과학 도구가 설치되어 있고 사람들이 즉시 사용할 수있는 Linux / Mac OS 이미지가 있습니까? 최신 버전의 Python, R (IDE 포함) 및 기타 오픈 소스 데이터 시각화 …
24 python  r  tools 


5
seaborn 히트 맵을 더 크게 만들기
corr()원본 df 에서 df를 만듭니다 . corr()DF는 70 X 70에서 나와는 히트 맵을 시각화하는 것은 불가능합니다 ... sns.heatmap(df). 를 표시하려고 corr = df.corr()하면 테이블이 화면에 맞지 않으며 모든 상관 관계를 볼 수 있습니다. df크기에 관계없이 전체를 인쇄 하거나 히트 맵의 크기를 제어하는 ​​방법입니까?
17 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 


2
리더 보드 점수의 마이닝 스트림에 도움이되는 오픈 소스 도구
온라인 게임에서 사용자의 점수를 나타내는 튜플이 포함 된 스트림을 고려하십시오 (user, new_score). 스트림은 초당 100-1,000 개의 새로운 요소를 가질 수 있습니다. 이 게임에는 고유 한 플레이어가 200K에서 300K까지 있습니다. 다음과 같은 스탠딩 쿼리를 원합니다. 1 시간 동안 슬라이딩 창에 x 점 이상의 점수를 올린 선수 1 시간 동안 슬라이딩 윈도우에서 …

2
실험 실행 및 결과의 책 보관
나는 연구원에 손을 잡고 실행 가능한 솔루션을 테스트하는 것을 좋아하므로 많은 실험을하는 경향이 있습니다. 예를 들어, 문서 간의 유사성 점수를 계산하는 경우 많은 측정 값을 시도 할 수 있습니다. 실제로 각 측정에 대해 일부 매개 변수의 효과를 테스트하기 위해 여러 번 실행해야 할 수도 있습니다. 지금까지 입력에 대한 정보가 많은 …

3
과학 컴퓨팅을위한 최고의 언어
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 대부분의 언어에는 몇 가지 과학 컴퓨팅 라이브러리가 있습니다. 파이썬은 Scipy Rust 있다 SciRust C++이 등 여러 가지 ViennaCL와Armadillo …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

4
대용량 데이터 세트를 이해하려면 어떤 초기 단계를 사용해야합니까? 어떤 도구를 사용해야합니까?
주의 사항 : 머신 러닝은 초보자이지만 배우기를 간절히 원합니다. 큰 데이터 세트가 있으며 패턴을 찾으려고합니다. 알려진 변수 또는 데이터에 포함되어 있지만 아직 깨닫지 못한 변수와 함께 데이터 전체에 상관 관계가있을 수 있습니다. 실제로는 변수 / 관련이 있습니다. 나는 이것이 데이터 분석 세계에서 익숙한 문제 일 것이라고 추측하고 있습니다. 그래서 몇 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.