John이 말했듯이 데이터 탐색에는 R에서 많은 프로그래밍이 필요하지 않습니다. 다음은 사람들에게 제공 할 수있는 데이터 탐색 명령 목록입니다. (방금 나 왔으며, 확실히 확장 할 수 있습니다.)
패키지에 들어있는 모든 데이터를 내 보냅니다. 따옴표없이 숫자 데이터를 내보내는 것이 편리합니다. 그런 다음 R의 데이터를 읽습니다.
ChickWeight=read.csv('chickweight.csv')
테이블을 만듭니다.
table(ChickWeight$Diet)
R이 어떤 종류의 그래픽을 제공하는지 추측 해 보자. 때로는 아주 잘 작동합니다.
plot(ChickWeight)
plot(ChickWeight$weight)
plot(ChickWeight$weight~ChickWeight$Diet)
여러 특정 플로팅 함수는 단일 변수에서 매우 간단하게 작동합니다.
hist(ChickWeight$weight)
서브 세트 가져 오기
plot(subset(ChickWeight,Diet=='2'))
사람들이 그것에 익숙한 경우 SQL과 같은 구문 (more here )
library(sqldf)
plot(sqldf('select * from ChickWeight where Diet == "2"'))
PCA (물론 변수가 두 개 이상 있습니다.)
princomp(~ ChickWeight$weight + ChickWeight$Time)