통계 + 컴퓨터 과학 = 데이터 과학? [닫은]


10

나는 데이터 과학자 가되고 싶다 . 응용 통계 (계리 과학)를 연구 했으므로 훌륭한 통계적 배경 (회귀, 확률 과정, 시계열, 몇 가지 언급)이 있습니다. 그러나 이제는 지능형 시스템 에서 컴퓨터 과학에 중점을 둔 석사 학위를 진행할 것 입니다.

여기 나의 학습 계획이 있습니다 :

  • 기계 학습
  • 고급 머신 러닝
  • 데이터 수집
  • 퍼지 로직
  • 추천 시스템
  • 분산 데이터 시스템
  • 클라우드 컴퓨팅
  • 지식 발견
  • 비즈니스 인텔리전스
  • 정보 검색
  • 텍스트 마이닝

마지막으로, 모든 통계 및 컴퓨터 과학 지식을 가지고 데이터 과학자라고 할 수 있습니까? 또는 내가 틀렸습니까?

답변 주셔서 감사합니다.



이 질문은 직업 조언에 관한 것이므로 주제가 아닌 것 같습니다. 진로 조언은 의견 지향적이고 광범위한 질문 또는 때로는 극도로 제한된 질문을 초래하는 것으로 입증되었으며, 대부분 유용한 담론이 없습니다. 이 의견에 동의하지 않으면 Data Science Meta 문제를 제기하십시오 .
asheeshr

간단히 말해서, 아닙니다. 데이터 + 과학적 방법 = 데이터 과학 :-). 다른 모든 것은 거기에 도달하는 방법론
일뿐입니다

답변:


1

전문가 데이터 과학자 가되기위한 올바른 길을 가고 있다고 생각합니다 . 최근에 나는 데이터 과학 StackExchange 여기에 관련 질문에 대답했다 : https://datascience.stackexchange.com/a/742/2452 받는 사람 (유료주의 정의 내가 언급, 그것은 본질적으로 당신의 그 자체로 문제뿐만 아니라에 관해서는이 응답으로 소프트웨어 엔지니어링 실습실제 문제 해결에 지식 적용의 측면 ). 나는 당신이 그 모든 유용한 것을 찾을 수 있기를 바랍니다. 당신의 경력에 ​​행운을 빕니다!


9

어떤 종류의 "데이터 과학"에 참여하고 있는지에 따라 다릅니다. 기본 분석 및보고 통계의 경우 확실히 도움이되지만 기계 학습 및 인공 지능의 경우 몇 가지 기술이 더 필요합니다.

  • 확률 이론 -문제의 가능성에 상관없이 확률 론적 원리로 분해 할 수 있도록 순수 확률로 탄탄한 배경을 가져야합니다. 통계는 이미 해결 된 문제에 많은 도움이되지만 새로운 문제와 해결되지 않은 문제는 적절한 기술을 설계 할 수 있도록 확률에 대한 깊은 이해가 필요합니다.

  • 정보 이론 -(통계와 관련하여) 이것은 상당히 새로운 분야이며 (여전히 수십 년 전임) 가장 중요한 작업은 Shannon이 수행 한 것이지만 문헌에서 더 중요하고 종종 무시되는 메모는 Hobson의 작업으로 Kullback-Leibler Divergence임을 증명했습니다. "정보 측정" 의 개념을 진정으로 포착하는 유일한 수학적 정의입니다 . 인공 지능의 기본은 정보를 정량화하는 것입니다. "통계 역학에서의 개념"-Arthur Hobson (아주 비싼 책, 학술 도서관에서만 사용 가능)을 읽는 것이 좋습니다.

  • 복잡성 이론-많은 복잡한 데이터 이론이없는 많은 데이터 과학자들이 직면 한 큰 문제는 알고리즘이 확장되지 않거나 대용량 데이터를 실행하는 데 시간이 오래 걸린다는 것입니다. 예를 들어 PCA를 생각해 보면 많은 사람들이 인터뷰 질문에 대해 "데이터 세트의 기능 수를 줄이려면 어떻게해야합니까?" O (n ^ 3) 인 PCA 당신이 눈에 띄고 싶다면, 빅 데이터가 그렇게 고집이되기 전에 오래 전에 디자인 된 교과서 솔루션을 포기하지 말고 자체적으로 각 문제를 해결할 수 있기를 원합니다. 이를 위해서는 이론적으로뿐만 아니라 실제로 얼마나 많은 시간이 소요되는지 이해해야합니다. 따라서 컴퓨터 클러스터를 사용하여 알고리즘을 배포하는 방법,

  • 커뮤니케이션 기술 -데이터 과학의 큰 부분은 비즈니스 이해입니다. 데이터 과학이 주도하는 제품을 개발하든, 데이터 과학이 주도하는 비즈니스 통찰력을 제공하든 프로젝트 및 제품 관리자, 기술 팀 및 동료 데이터 과학자와의 의사 소통이 매우 중요합니다. 놀라운 아이디어를 가지고 멋진 AI 솔루션을 말할 수는 있지만 (a) 비즈니스 돈을 벌 수있는 이유를 효과적으로 전달할 수없는 경우, (b) 동료에게 효과가 있는지 확인하고 (c) 기술 담당자에게 필요한 방법을 설명 그것을 구축하는 데 도움이되면 완료되지 않습니다.


6

데이터 과학자 (나에게) 큰 용어입니다. 데이터 과학자는 데이터 마이닝, 기계 학습, 패턴 분류 및 통계 분야의 기술을 능숙하게 사용할 수있는 사람으로 생각합니다.

그러나 머신 러닝은 패턴 분류와 관련이 있으며 데이터에서 패턴을 찾을 때 데이터 마이닝이 겹칩니다. 모든 기술에는 기본 통계 원칙이 있습니다. 나는 항상 이것을 큰 교차로가있는 벤 다이어그램으로 묘사합니다.

컴퓨터 과학은 모든 분야와 관련이 있습니다. 컴퓨터 과학 연구를 수행하려면 "데이터 과학"기술이 필요하지만 컴퓨터 과학 지식이 반드시 "데이터 과학"에 암시되는 것은 아닙니다. 그러나 프로그래밍 기술-프로그래밍과 컴퓨터 과학을 다른 직업이라고 생각합니다. 프로그래밍은 문제를 해결하기 위해 도구가 더 중요합니다. 또한 데이터 작업과 데이터 분석을 수행하는 데 중요합니다.

당신은 정말 좋은 공부 계획을 가지고 있으며, 그것은 모두 의미가 있습니다. 그러나 당신이 "데이터 과학자"라고 부르기를 "원한다"고 확신 할 수 없다면, "데이터 과학자"가 모든 것을 의미하거나 전혀 의미가없는 모호한 용어라는 인상을 받았습니다. 제가 전하고자하는 것은 데이터 과학자 인 "그냥"보다 더 "전문화 된"것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.