이전 질문에서 CSV 파일 편집 도구에 대해 물었습니다 .
Gavin 은 Duncan Murdoch의 R Help에 대한 의견에 링크하여 데이터 교환 형식이 CSV보다 데이터를 저장하는 것이 더 안정적인 방법이라고 제안했습니다.
일부 응용 프로그램의 경우 전용 데이터베이스 관리 시스템이 필요합니다. 그러나 소규모 데이터 분석 프로젝트의 경우 더 가벼운 것이 더 적합합니다.
파일 형식을 평가하기 위해 다음 기준을 고려하십시오.
- reliabile : 입력 한 데이터는 입력 한 내용을 그대로 유지해야합니다. 데이터는 다른 소프트웨어에서 지속적으로 열어야합니다.
- 단순 : 파일 형식을 이해하기 쉽고 간단한 텍스트 편집기로 이상적으로 읽을 수 있으면 좋을 것입니다. 형식을 읽고 쓰는 간단한 프로그램을 작성하는 것이 쉬워야합니다.
- open : 형식이 열려 있어야합니다
- 상호 운용성 : 많은 시스템에서 파일 형식을 지원해야합니다
신뢰성 기준에서 탭과 쉼표로 구분 된 값 형식이 실패한다는 것을 알았습니다. 파일 형식이 아닌 가져 오기 및 내보내기 프로그램을 비난 할 수 있다고 생각합니다. 나는 종종 read.table
이상한 캐릭터가 데이터 프레임의 로딩을 방해하는 것을 막기 위해 옵션을 약간 조정해야한다는 것을 알게
됩니다.
질문
- 이러한 요구에 가장 적합한 파일 형식은 무엇입니까?
- 데이터 교환 형식이 더 나은 대안입니까? 아니면 자체 문제가 있습니까?
- 바람직한 다른 형식이 있습니까?
- TSV 및 CSV를 부당하게 평가하고 있습니까? 파일 형식을보다 안정적으로 만드는 그러한 파일로 작업하기위한 간단한 팁이 있습니까?
write.DIF()
두려워하는 일방 통행 거리입니다.