일상 업무에서 가장 유용한 R 패키지는 무엇입니까?


28

중복 스레드 : 최신 버전의 R을 설치했습니다. 어떤 패키지를 구해야합니까?

일상적인 데이터 작업을 상상할 수 없었던 R 패키지 는 무엇입니까 ? 일반 도구와 특정 도구를 모두 나열하십시오.

업데이트 : 24.10.10 ggplot2은 7 표를 얻은 승자 인 것 같습니다.

하나 이상 언급 된 다른 패키지는 다음과 같습니다.

  • plyr -4
  • RODBC, RMySQL-4
  • sqldf - 삼
  • lattice -2
  • zoo -2
  • Hmisc/rms -2
  • Rcurl -2
  • XML -2

답변 주셔서 감사합니다!


1
매우 주관적인 질문 :이 질문에 대답 할 수 없으며 품질 보증 사이트에 적합하지 않습니다.
Egon Willighagen

3
커뮤니티 위키 일 것입니다. 유용한 질문이 있지만 명확한 대답은 없습니다.
셰인

2
@Shane : 좋은 지적입니다. 움직이는. @ Egon : 실제로 주관적입니다. 그러나 답이 지식이 풍부한 사람들로부터 온다면 나는 주관적인 복용량을 신경 쓰지 않습니다. 나는 최근에 R을 배우기 시작했고 탐험하기 위해 수십 개를 설치했지만, 과제에 관계없이 훨씬 자주 사용하는 도구가 있음을 알았습니다.
radek

StackExchange가 여러 사이트에서 커뮤니티 위키 게시물을 연결하는 방법을 지원할 수 있다면 흥미로울 것입니다. 이 질문에 Stackoverflow에 대한 질문이 있었으며 통계 분석은 일반적으로 SO를 방문하지 않는 일부 사람들을 끌어 들일 수 있다고 생각합니다.
Sharpie

@Sharpie : stackoverflow.com/questions/1295955/… 또는 stackoverflow.com/questions/1535021/… 과 같은 흥미로운 SO 게시물이 몇 개 있지만 패키지에 중점을 두지는 않습니다. 커뮤니티 위키의 연결이 정말 유용 할 수 있다는 데 동의합니다.
radek

답변:




8

xtable 패키지를 사용합니다 . xtable 패키지는 R에 의해 생성 된 테이블 (특히 anova 결과를 표시하는 테이블)을 기사에 포함되도록 LaTeX 테이블로 변환합니다.



8

ggplot2 -R에 대한 최상의 시각화를 제공합니다.

RMySQL / RSQLite / RODBC- 데이터베이스 연결 용

sqldf -SQL 쿼리로 data.frames 조작

Hmisc / rms- 편리한 기타 기능과 회귀 분석을위한 훌륭한 기능을 포함하는 Frank Harrell 패키지.

GenABEL- 게놈 전체 협회 연구를위한 훌륭한 패키지

Rcmdr- 필요한 경우 R에 알맞은 GUI.

CRANtastic 도 확인하십시오. 이 링크 에는 가장 많이 사용되는 R 패키지 목록이 있습니다. 목록 상단에있는 많은 사람들이 이미 언급되었습니다


8

data.table은 지금 내가 가장 좋아하는 것입니다! 더 많은 위시리스트가 구현 된 새 버전을 기대합니다.



6

개인적으로 다음 세 가지 패키지를 가장 많이 사용합니다. 통계 컴퓨팅을위한 오메가 프로젝트 (전문가라고 주장하지는 않지만 제 목적으로는 사용하기 매우 쉽습니다).

  • RCurl : 기본 R의 기본 기능에 어려움을 겪을 웹 사이트에 액세스 할 수있는 많은 옵션이 있습니다. 그것은이있는 libcurl에서 라이브러리에 대한 R-인터페이스 추가 를 개발 R의 전체 사회 외부의 혜택을. 에 제공CRAN .

  • XML : 잘못된 XML / HTML 구문 분석을 매우 용서합니다. 이것은 libxml2 라이브러리에 대한 R- 인터페이스 이며 R 외부에서도 커뮤니티 전체의 이점을 추가로 제공하며 CRAN 에서도 사용 가능합니다 .

  • RJSONIO : json 호출에서 반환 된 텍스트를 구문 분석하고 추가 분석을 위해 목록 구조로 구성 할 수 있습니다.이 패키지의 경쟁자는 rjson이지만 S3 / S4를 통해 벡터화되고 빠르게 확장 할 수 있다는 이점이 있습니다. 대용량 데이터로 확장 가능합니다.

6

엮다 사용하면 LaTeX 문서에 R 코드를 포함시킬 수 있습니다. 코드 실행 결과 및 선택적으로 소스 코드는 최종 문서의 일부가됩니다.

예를 들어, R에서 생성 된 이미지를 LaTeX 파일에 붙여 넣는 대신 R 코드 를 파일에 붙여 넣고 모든 것을 한 곳에 보관할 수 있습니다.


4
R로 재현 가능한 연구를 시작하려는 모든 사람들을위한 힌트 knitr. Sweave 대신 새로운 패키지 를 살펴 보라고 조언합니다 . 그것은 스테로이드에 기본적으로 Sweave입니다. 쉽지는 않지만 배우는 것이 훨씬 쉽고 유연합니다.
Christoph_J


4

Deepayan Sarkar의 "Lattice : Multivariate Data Visualization with R"이라는 책과 함께 격자 를 볼 수 있습니다.


4

예측 모델링을 수행하는 경우 캐럿 은 신의 선물입니다. 특히 멀티 코어 패키지 와 결합하면 매우 놀라운 것들이 가능합니다.


4

일상적으로 가장 유용한 패키지는 Stata, SPSS, Minitab, SAS 등과 같은 다른 통계 패키지에 대한 데이터를 읽고 쓰는 기능이있는 "외국"이어야합니다. 매우 중요한 패키지입니다.


3

나는 사용한다

자동차, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, 형태 변경, RODBC, TeachingDemos, XML.

많이.


3

나는 없이는 살 수 없었다 :

  • 그래픽 격자
  • Excel 파일을 읽기위한 xlsx 또는 XLConnect
  • RTF는 RTF 형식으로 보고서를 작성할 수 (내가 선호하는 이나 R2wd 하지만 난 직장에서 statconn 설치할 수 없습니다, 나는 확실히하려고합니다 odfWeave을 . 곧)
  • 혼합 모델의 경우 nlmelme4
  • 큰 배열 작업을위한 ff

2

데이터베이스에서 데이터에 액세스하기위한 RODBC , 데이터 프레임에서 간단한 SQL 쿼리를 수행하기위한 sqldf (기본 R 명령을 사용하도록 강요하더라도) 및 ggplot2plyr



2

우리는 주로 다음을 사용합니다.

  • ggplot-차트 용
  • 통계
  • e1071- SVM 용

kernlab과 caret를 확인하여 SVM을 확인할 수도 있습니다. 그들은 흥미로운 대안이 될 것입니다.
Zach


2

나를 위해 내가 사용하고 kernlab 커널 기반 기계 학습 연구소 및 e1071 SVM과 ggplot2 그래픽을


2

나는 ggplot2를 사용하고 비건 채식을하고 자주 모양을 바꿉니다.




2

나는 빠른 for 루프가 필요하거나 R과 호환되지 않는 치료를 수행해야 할 때 RCPP의 열렬한 팬입니다. R 에코 시스템에서 매우 잘 구현되어 있으며 함수의 인수로 변환하지 않고 Matrix / sparse Matrix를 수신 할 수 있습니다.

C ++ 구문은 간단한 일을 할 때 쉽습니다 (종종 필자의 경우).

실제로이 멋진 라이브러리를 필요로하기 위해 패키지 제작자가 될 필요는 없습니다.

C ++이 매우 빠르다고 말했습니까?


2

doParallelforeach는 패키지 내 코드를 병렬화와의 컴퓨팅에 최적화 된 인스턴스를 실행할 수 있도록하여 너무 쉽게 내 인생을 만들었습니다 아마존 EC2 ! 나는 그것들을 매우 자주 사용합니다. 그러나 Louis Aslett이 발표 한 RStudio AMI 가 없었다면 불가능했을 것 입니다. 마지막으로, 스트링 작업을 실제로 공원에서 산책 시키는 스트링거 패키지 에 대해 언급해야합니다 . 모든 텍스트 마이닝 응용 프로그램에서 사용하십시오. 또한 knitr를 매우 자주 사용 하여 고품질의 작업 보고서를 작성합니다. 이 놀라운 패키지 Yihui Xie에 많은 감사드립니다!


1

ggplot2, 모양 변경, 격자, 편직기를 더 자주 사용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.