저는 실험실 (자원 봉사자)의 연구 조교입니다. 저와 소규모 그룹은 대규모 연구에서 가져온 일련의 데이터에 대한 데이터 분석 작업을 수행했습니다. 불행히도 데이터는 일종의 온라인 앱으로 수집되었으며 가장 유용한 형식으로 데이터를 출력하도록 프로그래밍되지 않았습니다.
아래 그림은 기본적인 문제를 보여줍니다. 나는 이것을 "개조"또는 "구조 변경"이라고 들었다.
질문 : 10k가 넘는 항목이있는 대용량 데이터 세트를 사용하여 그림 1에서 그림 2로 이동하는 가장 좋은 프로세스는 무엇입니까?
data.table
,dplyr
,plyr
,와reshape2
- 가능하면 내가 Excel 및 피벗 테이블을 피하는 것이 좋습니다.