드류 콘웨이 (Drew Conway)는 Data Science Venn Diagram을 발간했습니다 .
한편으로, 당신은 정말로 그의 게시물을 읽어야합니다. 다른 한편으로, 나는 나 자신의 경험을 제공 할 수있다 : 나의 주제 전문 지식 (당신이 수학 / 통계와 해킹에서 "실질적 전문성"도 가지고 있어야하기 때문에 "실질적 전문성"보다 용어로 더 좋아한다)은 소매업에서 수학 / 통계는 예측 및 추론 통계이며 해킹 기술은 R에 있습니다.
이 유리한 지점에서 소매점과 이야기하고 이해할 수 있으며,이 분야에 대해 최소한의 지식이없는 사람은 소매점과의 프로젝트에서 가파른 학습 곡선에 직면해야합니다 . 사이드 공연으로, 나는 심리학에서 통계를 수행하며, 정확히 동일합니다. 그리고 다이어그램의 해킹 / 수학 / 통계 부분에 대한 지식이 많더라도 신용 점수 또는 다른 새로운 주제 분야에서 속도를내는 데 어려움을 겪을 것입니다.
당신은 수학 / 통계 및 해킹 기술의 일정 금액이되면은 많은 추가하는 것보다 하나 또는 그 이상의 과목에서 접지를 얻기 위해 더 나은 아직 당신의 해킹 기술에 다른 프로그래밍 언어를, 또는 아직수학 / 통계 포트폴리오에 대한 또 다른 기계 학습 알고리즘. 결국, 수학 / 통계 / 해킹이 확실 해지면 웹이나 교과서에서 새로운 도구를 비교적 짧은 시간에 배울 수 있습니다. 그러나 주제 전문 지식은 0부터 시작하면 처음부터 배울 수 없을 것입니다. 또한 클라이언트는 B가 수학 / 통계 / 해킹에서 더 우수하더라도 먼저 기본 사항을 배워야하는 다른 데이터 과학자 B보다 자신의 특정 분야를 이해하는 일부 데이터 과학자 A와 함께 작업합니다.
물론,이 모든 것 또한 당신이 세 분야 중 하나 에서 전문가가되지 않을 것이라는 것을 의미 할 것 입니다. 그러나 프로그래머 나 통계 학자 또는 주제 전문가가 아닌 데이터 과학자이기 때문에 괜찮습니다. 당신이 배울 수있는 별도의 서클에는 항상 사람들이있을 것입니다. 데이터 과학에 대해 내가 좋아하는 것의 일부입니다.
편집 : 잠시 후 몇 가지 생각을 하고이 게시물을 새로운 버전의 다이어그램으로 업데이트하고 싶습니다. 나는 여전히 해킹 기술, 수학 및 통계 지식 및 실질적인 전문성 (가독성을 위해 "프로그래밍", "통계"및 "비즈니스"로 단축 됨)이 중요하다고 생각하지만 커뮤니케이션 의 역할 도 중요 하다고 생각합니다 . 해킹, 통계 및 비즈니스 전문 지식을 활용하여 얻은 모든 통찰력 은 고유 한 지식이 혼합되어 있지 않은 사람들에게 전달할 수 없다면 큰 차이가 없습니다 . 돈을 쓰거나 프로세스를 변경하도록 확신해야하는 비즈니스 관리자에게 통계적 통찰력을 설명해야 할 수도 있습니다. 또는 통계적으로 생각하지 않는 프로그래머에게.
여기에 새로운 데이터 과학 벤 다이어그램이 있습니다. 여기에는 의사 소통이 필수 요소로 포함되어 있습니다. 기억하기 쉬우면서 최대의 타 오르기를 보장하는 방식으로 해당 영역에 라벨을 붙였습니다.
의견을 말하십시오.
R 코드 :
draw.ellipse <- function(center,angle,semimajor,semiminor,radius,h,s,v,...) {
shape <- rbind(c(cos(angle),-sin(angle)),c(sin(angle),cos(angle))) %*% diag(c(semimajor,semiminor))
tt <- seq(0,2*pi,length.out=1000)
foo <- matrix(center,nrow=2,ncol=length(tt),byrow=FALSE) + shape%*%(radius*rbind(cos(tt),sin(tt)))
polygon(foo[1,],foo[2,],col=hsv(h,s,v,alpha=0.5),border="black",...)
}
name <- function(x,y,label,cex=1.2,...) text(x,y,label,cex=cex,...)
png("Venn.png",width=600,height=600)
opar <- par(mai=c(0,0,0,0),lwd=3,font=2)
plot(c(0,100),c(0,90),type="n",bty="n",xaxt="n",yaxt="n",xlab="",ylab="")
draw.ellipse(center=c(30,30),angle=0.75*pi,semimajor=2,semiminor=1,radius=20,h=60/360,s=.068,v=.976)
draw.ellipse(center=c(70,30),angle=0.25*pi,semimajor=2,semiminor=1,radius=20,h=83/360,s=.482,v=.894)
draw.ellipse(center=c(48,40),angle=0.7*pi,semimajor=2,semiminor=1,radius=20,h=174/360,s=.397,v=.8)
draw.ellipse(center=c(52,40),angle=0.3*pi,semimajor=2,semiminor=1,radius=20,h=200/360,s=.774,v=.745)
name(50,90,"The Data Scientist Venn Diagram",pos=1,cex=2)
name(8,62,"Communi-\ncation",cex=1.5,pos=3)
name(30,78,"Statistics",cex=1.5)
name(70,78,"Programming",cex=1.5)
name(92,62,"Business",cex=1.5,pos=3)
name(10,45,"Hot\nAir")
name(90,45,"The\nAccountant")
name(33,65,"The\nData\nNerd")
name(67,65,"The\nHacker")
name(27,50,"The\nStats\nProf")
name(73,50,"The\nIT\nGuy")
name(50,55,"R\nCore\nTeam")
name(38,38,"The\nGood\nConsultant")
name(62,38,"Drew\nConway's\nData\nScientist")
name(50,24,"The\nperfect\nData\nScientist!")
name(31,18,"Comp\nSci\nProf")
name(69,18,"The\nNumber\nCruncher")
name(42,11,"Head\nof IT")
name(58,11,"Ana-\nlyst")
name(50,5,"The\nSalesperson")
par(opar)
dev.off()