«beginner» 태그된 질문

데이터 과학 또는 관련 하위 도메인에서 시작하는 것과 관련된 질문입니다.

3
높은 수준의 RNN vs CNN
저는 RNN (Recurrent Neural Networks)과 그 품종 및 CNN (Convolutional Neural Networks)과 품종에 대해 생각하고 있습니다. 이 두 가지 요점이 공정한 것입니까? CNN을 사용하여 구성 요소 (예 : 이미지)를 하위 구성 요소 (예 : 이미지의 오브젝트 개요와 같은 이미지의 오브젝트)로 분리하십시오. RNN을 사용하여 하위 구성 요소 (이미지 캡션, 텍스트 생성, …

8
인터넷 회사는 왜 데이터 과학자 직업에 Java / Python을 선호합니까?
데이터 과학자가 Python / Java 경험을 요구하고 R을 무시하는 작업 설명에서 여러 번 보았습니다. 아래는 링크 인을 통해 신청 한 회사의 수석 데이터 과학자로부터받은 개인 이메일입니다. X, 연결하고 관심을 가져 주셔서 감사합니다. 당신은 좋은 분석 기술이 있습니다. 그러나 인터넷 / 모바일 조직이므로 모든 데이터 과학자는 Java / Python에서 우수한 프로그래밍 …

1
xgboost가 GradientBoostingClassifier를 sklearn보다 훨씬 빠른 이유는 무엇입니까?
100 개의 숫자 기능을 가진 50k 개 이상의 그라디언트 부스팅 모델을 훈련하려고합니다. XGBClassifier동안 내 컴퓨터 43 초 이내에 핸들 (500) 나무, GradientBoostingClassifier핸들 10 나무 (!) 일분 2 초 :( 내가 귀찮게하지 않았다에서 그것은 시간이 걸릴 것으로 500 그루의 나무를 성장하려고합니다. 나는 같은 사용하고 있습니다 learning_rate및 max_depth설정 아래를 참조하십시오. XGBoost를 훨씬 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

2
계절성 또는 기타 패턴의 변화를 나타내는 시계열을 처리하는 방법은 무엇입니까?
배경 에너지 미터 판독 값의 시계열 데이터 세트를 작업 중입니다. 시리즈의 길이는 미터에 따라 다릅니다. 일부는 몇 년 동안, 다른 일부는 몇 개월에 불과합니다. 많은 사람들이 일, 주 또는 연도 내에 상당한 계절 성과 종종 여러 레이어를 표시합니다. 내가 작업 한 것 중 하나는 이러한 시계열의 클러스터링입니다. 저의 작업은 현재 …

3
딥 러닝 라이브러리를 사용하여 텍스트에서 키워드 / 구문 추출
아마도 이것은 너무 광범위하지만 텍스트 요약 작업에서 딥 러닝을 사용하는 방법에 대한 참조를 찾고 있습니다. 나는 표준 단어 빈도 접근법과 문장 순위를 사용하여 텍스트 요약을 이미 구현했지만이 작업에 딥 러닝 기술을 사용할 가능성을 탐색하고 싶습니다. 또한 감정 분석을 위해 CNN (Convolutional Neural Networks)을 사용하여 wildml.com에 제공된 일부 구현을 살펴 보았습니다 …

3
데이터 과학을 스스로 배우는 방법? [닫은]
휴무 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 3 년 전 . 나는 독학으로 웹 개발자이며 데이터 과학을 가르치는 데 관심이 있지만 시작 방법을 잘 모르겠습니다. 특히 궁금합니다. 데이터 …

5
기여할 오픈 소스 데이터 과학 프로젝트
오픈 소스 프로젝트에 참여하는 것은 일반적으로 초보자를위한 연습을하고 경험이 풍부한 데이터 과학자 및 분석가를위한 새로운 영역을 시도하는 좋은 방법입니다. 어떤 프로젝트에 기여합니까? Github에 소개 + 링크를 제공하십시오.

2
특정 주제에 대한 지식이없는 데이터 과학, 경력으로 추구 할 가치가 있습니까? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? Data Science Stack Exchange에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 최근에 누군가와 대화를 나누고 데이터 분석에 관심이 있으며 필요한 기술과 도구를 배우려는 사람을 언급했습니다. 그들은 특정 분야에 대한 전문 지식이 없으면 도구를 …

7
저는 프로그래머입니다. 어떻게 데이터 과학 분야에 들어가나요?
우선이 용어는 너무 모호하게 들립니다. 어쨌든 .. 나는 소프트웨어 프로그래머입니다. 내가 코딩 할 수있는 언어 중 하나는 Python입니다. 데이터 말하기 SQL을 사용할 수 있고 데이터 스크랩 핑을 수행 할 수 있습니다. 내가 지금까지 알아 낸 것은 많은 과학 기술 자료에 대한 많은 기사를 읽었습니다. 1- 통계 2- 대수 3- 데이터 …
13 beginner  career 

3
비정형 텍스트 분류
구조화되지 않은 텍스트 문서, 즉 구조가 알려지지 않은 웹 사이트를 분류하려고합니다. 내가 분류하고있는 수업의 수는 제한되어 있습니다 (이 시점에서는 3 명 이하라고 생각합니다). 누구든지 내가 어떻게 시작할 수 있는지 제안 했습니까? 여기서 "단어"접근이 가능한가? 나중에 문서 구조 (아마도 의사 결정 트리)를 기반으로 다른 분류 단계를 추가 할 수 있습니다. Mahout과 …

4
대용량 데이터 세트를 이해하려면 어떤 초기 단계를 사용해야합니까? 어떤 도구를 사용해야합니까?
주의 사항 : 머신 러닝은 초보자이지만 배우기를 간절히 원합니다. 큰 데이터 세트가 있으며 패턴을 찾으려고합니다. 알려진 변수 또는 데이터에 포함되어 있지만 아직 깨닫지 못한 변수와 함께 데이터 전체에 상관 관계가있을 수 있습니다. 실제로는 변수 / 관련이 있습니다. 나는 이것이 데이터 분석 세계에서 익숙한 문제 일 것이라고 추측하고 있습니다. 그래서 몇 …

1
R을 사용하여 의사 결정 트리를 작성할 때 데이터를 정규화해야합니까?
따라서 이번 주 데이터 세트에는 14 개의 속성이 있으며 각 열의 값은 매우 다릅니다. 한 열의 값은 1 미만이고 다른 열의 값은 3 자리에서 4 자리 숫자입니다. 지난 주에 정규화를 배웠으며 값이 매우 다른 경우 데이터를 정규화해야하는 것으로 보입니다. 의사 결정 트리의 경우도 마찬가지입니까? 확실하지 않지만 정규화가 동일한 데이터 세트의 …
10 r  beginner 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.