데이터 처리에서 정리, 녹이는 것까지 SQL Server가 모든 작업의 중추 인 사무실에서 근무하고 있습니다. 저의 동료는 들어오는 데이터를 표준화하여 보고서, 시각화 및 분석 프로젝트에서 사용할 수 있도록 복잡한 함수 및 저장 프로 시저를 작성하여 들어오는 데이터를 체계적으로 처리하는 데 전문적입니다. 여기서 시작하기 전에 가장 기본적인 쿼리를 작성하는 것 외에는 SQL에 대한 경험이 거의 없었습니다. 분석 준비 작업의 대부분은 R에서 모두 수행되었습니다. 상사는 R을 사용하여 더 효율적으로 수행 할 수있는 코드가 적고 할당이 거의없는 것처럼 보이지만 SQL 기술을 향상시킬 것을 주장합니다. dplyr, data.table 및 tidyr와 같은 패키지 (예를 들어). 내 질문은-이것이 의미가 있습니까?
몇 주 전에 필자는 특정 기준을 충족하는 테이블의 각 행에 대한 열 이름 목록을 가져 와서 문자열 벡터로 연결하는 작업에 직면했습니다. 마감 시간이 촉박했으며 당시에는 막힘이 발생하여 문제를 해결하지 못했습니다. 나는 상사에게 문제를 해결하기 위해 TSQL 스크립트를 작성하도록 동료에게 요청했습니다. 그가 작업하는 동안 R에서 상당히 간단한 함수를 작성하고 데이터 프레임에 적용하는 방법을 알아 냈습니다. 제 동료는 약 2 시간 후에 그의 대본을 가지고 돌아 왔습니다. 2 개의 중첩 된 for 루프를 포함하는 최소 75 개의 라인이었습니다. 나는 그에게 달려가는 시간을 알려주고 몇 시간이 걸릴 것이라고 말했다. 한편 내 R 스크립트는 약 30 초 안에 ~ 45,000 레코드를 반복 할 수있었습니다.
R이 데이터를 정리하고 녹이는 데 훨씬 더 나은 선택이라고 가정 할 수 있습니까? 내 사무실의 SQL 개발자가 부적절했을까요? R과 SQL (또는 그 문제에 대해 Python과 SQL)로 일한 사람이 이것에 대해 생각이 있는지 궁금합니다.