Data Science 인증에 대해 어떻게 생각하십니까?


35

이제 코스 라에서 제공 되는 John HopkinsCloudera 중 하나 인 두 가지 데이터 과학 인증 프로그램을 보았습니다 .

나는 거기에 다른 사람들이 있다고 확신합니다.

John Hopkins 클래스 세트는 도구 세트로서 R에 중점을 두지 만 다양한 주제를 다룹니다.

  • R 프로그래밍
  • 데이터 청소 및 확보
  • 데이터 분석
  • 재현 가능한 연구
  • 통계적 추론
  • 회귀 모형
  • 기계 학습
  • 데이터 제품 개발
  • Cloudera의 데이터 과학 챌린지와 유사한 프로젝트 기반 완료 작업으로 보이는 것

Cloudera 프로그램은 표면이 얇아 보이지만 두 가지 중요한 질문 인 "도구를 알고 있습니까?", "실제로 도구를 적용 할 수 있습니까?" 그들의 프로그램은 다음과 같이 구성됩니다.

  • 데이터 과학 소개
  • 데이터 과학 필수 시험
  • 데이터 과학 도전 (실제 데이터 과학 프로젝트 시나리오)

프로그램이나 품질 비교에 대한 권장 사항을 찾고 있지 않습니다.

다른 인증, 해당 주제 및 DS 인증이 현재 커뮤니티에서 얼마나 심각하게 보이는지 궁금합니다.

편집 : 이들은 모두 좋은 답변입니다. 나는 투표로 정답을 선택하고 있습니다.


4
이것은 너무 광범위하고 주로 의견에 근거합니다. 살펴 보시기 바랍니다 datascience.stackexchange.com/help/dont-ask을
asheeshr

3
@AsheeshR-우리는 하루에 2 개의 질문과 1 개의 질문에 대해 2 개의 답변을 평균합니다. 이 시점에서 참여를 장려하고 관심을 높이는 데 중점을 두어야합니다.
Steve Kallestad 2016 년

10
현장 품질을 희생하여 참여하는 것은 해결책이 아닙니다. 참여는 일시적입니다. 나중에 품질을 변경하기가 훨씬 어렵습니다.
asheeshr 2016 년

4
자전거 , 직장 , 개인 금융 및 돈 , 회의론자 , 게임 개발은 모두 하루에 10 개 미만의 질문으로 시작되었습니다. 자전거 는 고품질 사이트로 간주되기 때문에 하루에 4 번 시작되었습니다.
asheeshr 2016 년

3
글쎄요 ...이 시점에서 승자를 선언해야한다고 생각합니다. :)
Steve Kallestad 2016 년

답변:


13

나는 처음 두 코스를했고 다른 모든 코스도 할 계획입니다. R을 모른다면 정말 좋은 프로그램입니다. 매주 과제와 퀴즈가 있습니다. 많은 사람들이 일부 과정을 매우 어렵게 생각합니다. 프로그래밍 경험이 없으면 어려움을 겪을 것입니다 (필요하지 않다고 말하더라도).

기억하십시오. F1 조종사 인 자동차를 운전할 수 있기 때문이 아닙니다.)


32

전 분석 관리자이자 현재의 수석 데이터 과학자 인 저는 데이터 과학 인증서의 필요성에 대해 매우 우려하고 있습니다. 데이터 과학자라는 용어는 매우 모호하며 데이터 과학 분야는 초기 단계입니다. 인증서는 데이터 과학이 부족한 일종의 통일 된 표준을 의미하며 여전히 서부 지역입니다.

인증서는 아마도 당신을 해치지 않을 것이지만, 나는 특정 접근법을 사용할 때를 알기 위해 경험을 개발하는 데 더 많은 시간을 소비하고 비 기술적 청중에게 그 접근법을 설명 할 수있는 깊이있는 이해를 할 수 있다고 생각합니다.


2
현재 직업이 데이터 과학이 아니라 관련 분야 (내 경우에는 통계)에 중점을 둔 경우 경험을 얻기가 어려운 경우가 있습니다. 나는이 과정을 사용하여 약간의 지식을 얻고 주제를 유지하며 주간 업무에서는 할 수 없습니다.
Christian Sauer

1
나는 코스가 당신에게 출발점을 제공하고 그 경험을 얻을 수있는 일부 구조를 제공하는 데 매우 중요하다는 것에 완전히 동의합니다. Mooc을 최대한 활용하려면 매우 구체적인 예를 들어 로지스틱 회귀를 말하고 실제로 다른 데이터 세트로 작업하면 코스가 가르치는 언어 이외의 언어로 수행하면 이중 보너스 .
neone4373

좋은 생각이야. 일반적으로 통계에서 누락 된 것은 교육 웹 사이트입니다. 예를 들어 목표 및 가능한 결과와 함께 데이터베이스 세트. khancademy와 같지만 더 강력한;)
Christian Sauer

11

언급 한 인증 프로그램은 실제로 엔트리 레벨 과정입니다. 개인적으로이 인증서는 개인의 끈기 만 보여 주며 실제 데이터 과학 직종이 아닌 인턴쉽을 신청하는 사람들에게만 유용 할 수 있다고 생각합니다.


동의한다. 강의 자료는 시작하기에 좋지만 대부분은 엔트리 레벨입니다.
Shagun Sodhani

10

저는 주요 인터넷 회사의 데이터 과학 팀을 이끌고 있으며 전 세계 팀을 위해 수백 개의 프로필을 선별하고 수십 개의 인터뷰를했습니다. 많은 지원자들이 앞서 언급 한 과정과 프로그램을 통과했거나 유사한 자격 증명을 가지고 있습니다. 개인적으로, 나는 또한 과정을 수강했고, 일부는 훌륭하고, 다른 것들은 실망하지만 그들 중 누구도 당신을 "데이터 과학자"로 만들지 않았습니다.

일반적으로 나는 여기에 다른 사람들과 동의합니다. Coursera 또는 Cloudera의 인증서는 관심을 나타내지 만 바늘을 움직이지 않습니다. 고려해야 할 것이 더 많으며 포괄적 인 작업 저장소 (예 : github 프로파일)를 제공하고 다른 데이터 과학자와 네트워킹함으로써 더 큰 영향을 줄 수 있습니다. 데이터 과학 프로필을 고용하는 사람은 항상 이전 작업 및 코딩 스타일 / 능력을 선호합니다.


8

여러 인증이 진행되고 있지만 초점 영역과 스타일이 다릅니다.

John Hopkins 전문화보다 eDX의 Analytics Edge가 훨씬 더 집중적이기 때문에 더 선호합니다. John Hopkins 전문 분야에 대한 기대는 웹 로그 분석 에지에서 주당 11-12 시간 대 주 3-4 시간으로 예상됩니다.

업계의 관점에서 볼 때 본인은 이러한 인증을 개인의 지식 수준이 아니라 관심의 표시로 간주합니다. 이 MOOC에 누락이 너무 많습니다. MOOC에서 XYZ 인증을받는 것보다 다른 경험 (Kaggle 경쟁에 참여하는 것과 같은)이 더 중요합니다.


2
그리고 stats.SE, datascience.SE 프로파일은 어떻습니까? 관련 지식 수준에 대해 많은 것을 말할 수 있다고 생각하십니까?
IharS

드롭 아웃과 관련이 있습니까? 아마도, 등록은 물론 과정을 마치면 인증이 조건에 따라 결정됩니다.
Gala

이러한 MOOC에 대한 과정을 통해 인증을 받고 있다고 언급하는 사람들이 많이 있습니다. 조심해야합니다.
Kunal

@Kunal 이해가 되겠지만 답변은 "인증"에서 "드롭 아웃"(아마도 인증이 없음 )으로 이동합니다. 여기서 핵심은 진행 중 입니다. 학생 등록 ​​또는 Kaggle 계정 등록과 약간 비슷합니다. 이 중 어느 것도 실제로 학위를 받았거나 과정을 이수한 사람이나 마지막 경쟁에 참여한 사람을 소중하게 여길 것인지 여부를 알려주지 않습니다.
갈라

6

클라우드 시대에 대해서는 확실하지 않지만 내 친구 중 한 명이 John Hopkins에 가입했으며 그의 말에 따르면 "시작하기에 훌륭합니다". 많은 사람들이 추천했습니다. 몇 주 안에 가입 할 계획입니다. 진지함에 관한 한,이 인증이 취업에 도움이 될 것이라고 생각하지는 않지만 확실히 배우는 데 도움이 될 것입니다.


4

@OP : 투표로 답을 선택하는 것이 최악의 생각입니다.

귀하의 질문은 인기 콘테스트가됩니다. 당신은 정답을 찾아야합니다. 나는 당신이 무엇을 요구하는지 알고, 당신이 찾고있는 것을 알고 있습니다.

귀하의 질문에 대답하기 위해 :
Q :이 시점에서 커뮤니티는 DS 인증을 얼마나 심각하게보고 있는가.

A :이 과정을 수강하는 목표는 무엇입니까? 직장, 학교, 자기 개선 등을 위해? Coursera 수업은 매우 적용되며 많은 이론을 배우지 않으며 의도적으로 수업 환경에 예약되어 있습니다.

그럼에도 불구하고 Coursera 수업은 매우 유용합니다. 나는 2 년의 석사 프로그램에서 1 년의 Stat grad 클래스에 해당한다고 말하고 싶습니다.

업계 인지도를 잘 모르겠습니다. 실제로 어떻게 과정을 수강했는지에 대한 문제가 있습니까? 당신은 얼마나 많은 시간을 보냈습니까? 강의실 종이 시험보다이 과정에서 A를 얻는 것이 훨씬 쉽습니다. 따라서 사람마다 큰 품질 차이가 있습니다.


질문의 일부는 커뮤니티가 인증에 가치를 부여했는지 여부를 측정하기위한 것입니다. 일부 지역에서는 인증이 절대적으로 필요합니다. 다른 경우에는 인증이 전혀 중요하지 않습니다. 또 다른 회사에서는 특정 회사의 인증이 높은 수준으로 유지되고 경쟁 인증은 그렇지 않습니다. 다른 부분은 인증의 주제별 초점 차이를 이해하기위한 것입니다. 데이터 과학은 광범위한 용어입니다. 인증은 일반적으로 더 집중됩니다. 이것은 품질 보증 형식에 대한 나쁜 질문입니다. 의견에 따라 더 많은 논의가 필요합니다.
Steve Kallestad

투표로 답을 선택했다는 점을 알아 두려는 목적은 모든 답을 읽을 가치가 있음을 분명히하는 것이 었습니다. 당신이 아래로 내려가는 것을 포함하여 모두가 좋은 지적을합니다. 이러한 것들에 대해 궁금해하는 사람은 자신을 상위 1 ~ 2 개의 답변으로 제한해서는 안됩니다.
Steve Kallestad

정답을 찾기 위해 투표하는 것은 끔찍한 생각입니다. 수학에 접근하는 것은 잘못된 방법입니다. 당신은 분명히 내 요점을 놓쳤다.
user13985

2

코스 라 인증의 효과는 개인뿐만 아니라 수업에 달려 있다고 생각합니다. 요구 사항은 일주일에 최소 3-5 시간이라고 말하고 더 많이 넣을 때 재료가 3-5 시간 이상 많이 열리면 이러한 클래스 및 인증은 해당 분야의 강력한 지식 기반 및 경험과 동등 할 수 있습니다 . 과학은 그것을 요구하는 사람들에게옵니다.


2

코스 라의 존스 홉킨스 데이터 과학 전문화 과정을 거의 마쳤습니다. 나는 당신에게 그것의 장단점을 주면서 가능한 한 객관적으로 유지하려고 노력할 것입니다.

찬성 :

  • 학습 과정에 대한 구조
  • 시간이 지남에 따라 포트폴리오를 구축하게됩니다

단점 :

  • 코스마다 다른 배경이 필요합니다. 처음 몇 과정은 이전 지식을 가정하지 않습니다. 개념 과정에서 갑자기 이해하기 쉽지 않습니다. (통계 추론, 회귀 분석)
  • 교수 3 명이 강의합니다. 잠재 고객과 능력 / 필요 / 관심에 대해 같은 페이지에 있지 않다고 생각합니다.

2

당신이 원하는 것을 보여줄 수있는 가장 좋은 방법은 당신이 그것을 할 수 있음을 보여줍니다.

언급 한 MOOC는 기본 사항을 잘 이해하고 머신 러닝 / 데이터 과학 문제를 해결하기에 충분해야합니다. 기술을 향상시킬 수있는 훌륭한 방법 인 Kaggle 경쟁을 시도하십시오. 그리고 잠재적 인 고용주에게 관심이있는 적절한 등급입니다. iPython Notebook과 같은 것을 사용하여 Github에 결과를 게시하면 작업을 쉽게보고 판단 할 수 있습니다.

UCI Bike Sharing Dataset 또는 UCI Diabetes Treatment Dataset 과 같은 다른 공개 데이터 세트에 대한 분석 을 시도해보십시오.


2

실제로 인증서를 부여하는 기관의 신뢰성에 달려 있습니다. 예를 들어, 하버드에 기반을 둔 회사의 데이터 과학 인증 은 많은 업계 파트너에 의해 인정되며 좋은 선택이 될 수 있습니다. 어떤 종류의 인증서를 찾고 있지 않습니까?


1

학생에게 가치있는 가방. 프로그램을 위해 수백 달러를 지불하거나 코스를 위해 수백 달러를 지불하는 것이 동기입니다.

MITx에서 하나의 시리즈를 완료했습니다. "알아야 할"사람들을 대상으로하는 방법과 도구에 대한 대학원 조사 과정입니다. 충분히 배워서 배운 내용을 편안하게 적용 할 수있었습니다.

방향성 비순환 그래프 방법에 대한 독립형 HarvardX 과정은 유대 진주 방법에 대한 통계에서 대학원 세미나와 비슷했습니다. 그렇지 않으면 너무 오래 들었을 것입니다.

HarvardX 시리즈는 신입생을 R 툴셋 ​​및 응용 프로그램에 맞추기위한 대학원 수준의 부트 캠프입니다.

BerkeleyX 시리즈는 거의 도메인 특정 언어 인 특수 목적의 Python 클래스를 사용하는 학부 조사 과정입니다.

수료증의 가치에 관해서는, 유일하게 관련된 교육 경험이 지구 물리학 석사였으며, 직업 설명 (고급 은행 변호사) 밖에서 약 1 년의 유급 경험이 있다고보고 할 수 있습니다.

아마도 인증서의 결과로, 내가 아는 최소한 두 가지 작업에 대해 "과잉 자격"으로 거절되었습니다. 그래서 제 조언은 만약 당신이 인증서를 가지고 있다면 "Excel"이라는 단어가 채용 공고에 나타날 경우 그 인증서를 언급하지 않는 것입니다.


1

이 그룹에 관심이있을 수있는 Harvard, MIT, Microsoft 등의 데이터 과학 과정을위한 edX 관련 리소스.

예를 들어, Harvard의 8 개 과정과 주석 시험으로 구성된 전문 인증 프로그램이 있습니다 .

보다 고급 연구를 위해 MIT의 MicroMasters 프로그램이 있습니다 .

뿐만 아니라 UC 샌디에고에서 하나 여기 . Data Science에 대한 훌륭한 개요를 위해 Microsoft 의 프로그램이 있습니다. 모든 프로그램에 대해서는 여기를 참조하십시오 .

이것이 도움이되기를 바랍니다.

edX의 Josh

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.