특정 주제에 대한 지식이없는 데이터 과학, 경력으로 추구 할 가치가 있습니까? [닫은]


15

최근에 누군가와 대화를 나누고 데이터 분석에 관심이 있으며 필요한 기술과 도구를 배우려는 사람을 언급했습니다. 그들은 특정 분야에 대한 전문 지식이 없으면 도구를 배우고 기술을 구축하는 것이 좋지만 그렇게 할 점이 거의 없다고 제안했습니다.

그들은 기본적으로 나는 단지 몇 개의 나무 상자를 만들 수 있고 더 나은 물건 (캐빈, 찬장 등)을 만들 수있는 도구 더미가있는 빌더와 같을 것이라고 요약했지만 특정 분야에 대한 지식이 없으면 결코 특정 제품을 위해 사람들이 방문하는 건축업자가 되십시오.

누구든지 이것을 찾았거나 이것으로 무엇을 만들어야하는지에 대한 의견을 가지고 있습니까? 그것이 사실이라면, 사물의 데이터 과학 측면을 배우고 전문화되기 위해 새로운 분야를 배워야 할 것입니다.


귀하의 질문은 유효하지만, 이것이 올바른 장소는 아닙니다. 경력 관련 질문은 여기서 다루지 않습니다.
sheldonkreger

무엇을 요구하는지는 확실하지 않습니다. 도구를 배우거나 도메인 지식을 수집하는 것이 더 낫습니까? StackExchange에 대해 너무 개방적이고 의견에 기반한 것 같습니다.
Sean Owen

답변:


43

드류 콘웨이 (Drew Conway)는 Data Science Venn Diagram을 발간했습니다 .

데이터 과학 벤 다이어그램

한편으로, 당신은 정말로 그의 게시물을 읽어야합니다. 다른 한편으로, 나는 나 자신의 경험을 제공 할 수있다 : 나의 주제 전문 지식 (당신이 수학 / 통계와 해킹에서 "실질적 전문성"도 가지고 있어야하기 때문에 "실질적 전문성"보다 용어로 더 좋아한다)은 소매업에서 수학 / 통계는 예측 및 추론 통계이며 해킹 기술은 R에 있습니다.

이 유리한 지점에서 소매점과 이야기하고 이해할 수 있으며,이 분야에 대해 최소한의 지식이없는 사람은 소매점과의 프로젝트에서 가파른 학습 곡선에 직면해야합니다 . 사이드 공연으로, 나는 심리학에서 통계를 수행하며, 정확히 동일합니다. 그리고 다이어그램의 해킹 / 수학 / 통계 부분에 대한 지식이 많더라도 신용 점수 또는 다른 새로운 주제 분야에서 속도를내는 데 어려움을 겪을 것입니다.

당신은 수학 / 통계 및 해킹 기술의 일정 금액이되면은 많은 추가하는 것보다 하나 또는 그 이상의 과목에서 접지를 얻기 위해 더 나은 아직 당신의 해킹 기술에 다른 프로그래밍 언어를, 또는 아직수학 / 통계 포트폴리오에 대한 또 다른 기계 학습 알고리즘. 결국, 수학 / 통계 / 해킹이 확실 해지면 웹이나 교과서에서 새로운 도구를 비교적 짧은 시간에 배울 수 있습니다. 그러나 주제 전문 지식은 0부터 시작하면 처음부터 배울 수 없을 것입니다. 또한 클라이언트는 B가 수학 / 통계 / 해킹에서 더 우수하더라도 먼저 기본 사항을 배워야하는 다른 데이터 과학자 B보다 자신의 특정 분야를 이해하는 일부 데이터 과학자 A와 함께 작업합니다.

물론,이 모든 것 또한 당신이 세 분야 중 하나 에서 전문가가되지 않을 것이라는 것을 의미 할 것 입니다. 그러나 프로그래머 나 통계 학자 또는 주제 전문가가 아닌 데이터 과학자이기 때문에 괜찮습니다. 당신이 배울 수있는 별도의 서클에는 항상 사람들이있을 것입니다. 데이터 과학에 대해 내가 좋아하는 것의 일부입니다.


편집 : 잠시 후 몇 가지 생각을 하고이 게시물을 새로운 버전의 다이어그램으로 업데이트하고 싶습니다. 나는 여전히 해킹 기술, 수학 및 통계 지식 및 실질적인 전문성 (가독성을 위해 "프로그래밍", "통계"및 "비즈니스"로 단축 됨)이 중요하다고 생각하지만 커뮤니케이션 의 역할 도 중요 하다고 생각합니다 . 해킹, 통계 및 비즈니스 전문 지식을 활용하여 얻은 모든 통찰력 은 고유 한 지식이 혼합되어 있지 않은 사람들에게 전달할 수 없다면 큰 차이가 없습니다 . 돈을 쓰거나 프로세스를 변경하도록 확신해야하는 비즈니스 관리자에게 통계적 통찰력을 설명해야 할 수도 있습니다. 또는 통계적으로 생각하지 않는 프로그래머에게.

여기에 새로운 데이터 과학 벤 다이어그램이 있습니다. 여기에는 의사 소통이 필수 요소로 포함되어 있습니다. 기억하기 쉬우면서 최대의 타 오르기를 보장하는 방식으로 해당 영역에 라벨을 붙였습니다.

의견을 말하십시오.

새로운 데이터 과학 벤 다이어그램

R 코드 :

draw.ellipse <- function(center,angle,semimajor,semiminor,radius,h,s,v,...) {
    shape <- rbind(c(cos(angle),-sin(angle)),c(sin(angle),cos(angle))) %*% diag(c(semimajor,semiminor))
    tt <- seq(0,2*pi,length.out=1000)
    foo <- matrix(center,nrow=2,ncol=length(tt),byrow=FALSE) + shape%*%(radius*rbind(cos(tt),sin(tt)))
    polygon(foo[1,],foo[2,],col=hsv(h,s,v,alpha=0.5),border="black",...)
}
name <- function(x,y,label,cex=1.2,...) text(x,y,label,cex=cex,...)

png("Venn.png",width=600,height=600)
    opar <- par(mai=c(0,0,0,0),lwd=3,font=2)
        plot(c(0,100),c(0,90),type="n",bty="n",xaxt="n",yaxt="n",xlab="",ylab="")
        draw.ellipse(center=c(30,30),angle=0.75*pi,semimajor=2,semiminor=1,radius=20,h=60/360,s=.068,v=.976)
        draw.ellipse(center=c(70,30),angle=0.25*pi,semimajor=2,semiminor=1,radius=20,h=83/360,s=.482,v=.894)
        draw.ellipse(center=c(48,40),angle=0.7*pi,semimajor=2,semiminor=1,radius=20,h=174/360,s=.397,v=.8)
        draw.ellipse(center=c(52,40),angle=0.3*pi,semimajor=2,semiminor=1,radius=20,h=200/360,s=.774,v=.745)

        name(50,90,"The Data Scientist Venn Diagram",pos=1,cex=2)
        name(8,62,"Communi-\ncation",cex=1.5,pos=3)
        name(30,78,"Statistics",cex=1.5)
        name(70,78,"Programming",cex=1.5)
        name(92,62,"Business",cex=1.5,pos=3)

        name(10,45,"Hot\nAir")
        name(90,45,"The\nAccountant")
        name(33,65,"The\nData\nNerd")
        name(67,65,"The\nHacker")
        name(27,50,"The\nStats\nProf")
        name(73,50,"The\nIT\nGuy")
        name(50,55,"R\nCore\nTeam")
        name(38,38,"The\nGood\nConsultant")
        name(62,38,"Drew\nConway's\nData\nScientist")
        name(50,24,"The\nperfect\nData\nScientist!")
        name(31,18,"Comp\nSci\nProf")
        name(69,18,"The\nNumber\nCruncher")
        name(42,11,"Head\nof IT")
        name(58,11,"Ana-\nlyst")
        name(50,5,"The\nSalesperson")
    par(opar)
dev.off()

1
업데이트 된 다이어그램을 참조하는 블로그 게시물을 통해 여기로 가져 왔습니다. 통계 교수는 통계와 의사 소통에서 동등한 기술을 가진 사람이라는 생각을 넘어서지 못합니다 (중복 크기로 암시 됨).
Robert de Graaf

1

물론 넌 할 수있어. 기업들은 데이터 과학자들에게 요구하고 있습니다. 그것들이 모두 그 용어를 다르게 해석하도록주의하십시오. 회사에 따라 통계에서 생산 코드 작성에 이르기까지 모든 작업을 수행해야 할 수도 있습니다. 하나는 전일제 직업이며 둘 다 준비해야하므로 그에 대한 깊은 전문 지식을 요구하는 것은 합리적이지 않습니다. 제 생각에는 다른 두 영역을 강조했습니다. 특히 프로그래밍). 그러나 나는 당신이 직면 할 수있는 문제 유형에 익숙해지는 것이 도움이된다는 것을 알았습니다. 업종에 따라 이상 감지, 추천 / 개인화, 예측, 레코드 연결 등이 될 수 있습니다. 이들은 수학 및 프로그래밍과 동시에 예제로 배울 수있는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.