큰 데이터 프레임의 전체 출력을 볼 이유가 없습니다. 큰 데이터 프레임을 보거나 조작하면 불필요하게 많은 양의 컴퓨터 리소스가 사용됩니다.
당신이 무엇을하든 미니어처로 할 수 있습니다. 데이터 프레임이 작을 때 데이터 코딩 및 조작 작업이 훨씬 쉽습니다. 빅 데이터를 사용하는 가장 좋은 방법은 큰 데이터 프레임의 일부 또는 작은 샘플 만 가져 오는 새 데이터 프레임을 만드는 것입니다. 그런 다음 작은 데이터 프레임에서 데이터를 탐색하고 코딩을 수행 할 수 있습니다. 데이터를 탐색하고 코드가 작동하게되면 더 큰 데이터 프레임에서 해당 코드를 사용하십시오.
가장 쉬운 방법은 head () 함수를 사용하여 데이터 프레임에서 첫 n 행의 첫 번째 행 수를 가져 오는 것입니다. head 함수는 n 개의 행 수만 인쇄합니다. 큰 데이터 프레임에서 헤드 기능을 사용하여 미니 데이터 프레임을 만들 수 있습니다. 아래에서 처음 50 행을 선택하고 그 값을 small_df에 전달하기로 선택했습니다. 이는 BigData가이 프로젝트를 위해 연 라이브러리에서 가져온 데이터 파일이라고 가정합니다.
library(namedPackage)
df <- data.frame(BigData) # Assign big data to df
small_df <- head(df, 50) # Assign the first 50 rows to small_df
대부분의 경우 작동하지만 때로는 큰 데이터 프레임에 미리 정렬 된 변수가 있거나 이미 그룹화 된 변수가 있습니다. 빅 데이터가 이와 같으면 빅 데이터에서 임의의 행 샘플을 가져와야합니다. 그런 다음 다음 코드를 사용하십시오.
df <- data.frame(BigData)
set.seed(1016) # set your own seed
df_small <- df[sample(nrow(df),replace=F,size=.03*nrow(df)),] # samples 3% rows
df_small # much smaller df