대학원 수준의 통계를 가르 칠 때 나는 학생들에게 다음과 같이 말했습니다. "어떤 패키지를 사용하든 상관없고, 실질적인 설명을 제공 할 것으로 예상되므로 숙제를 위해 무엇이든 사용할 수 있습니다. 보다 tr23y5m
제출에서 변수 이름. 저는 Stata에서, R에서 합리적으로 잘 학습 할 수 있도록 지원할 수 있습니다. SAS를 사용하면 강의를 수강했다고 주장 할 때 본인이 스스로 공부하게됩니다. SPSS 나 Minitab을 사용하면 신의 축복을 빕니다. "저는 합리적인 고용주들이 똑같이 생각할 것이라고 생각합니다. 프로젝트 성과 측면에서 생산성이 중요합니다. 40 시간의 노동으로 R에서 목표를 달성 할 수 있다면, 좋습니다 40 시간의 작업으로 C ++로 달성 할 수 있습니다 .40 시간 안에 R에서이 작업을 수행하는 방법을 알고 있지만 관리자가 SAS에서이 작업을 수행하기를 원하면 몇 가지 기본 사항을 배우기 위해 60 시간을 소비해야합니다. 세미콜론이가는 곳은 SAS의 나머지 코드에 대한 큰 그림의 맥락에서만 현명 할 수 있습니다. 그러면 관리자는 R 프로그래머를 고용하는 것이 현명하지 않았습니다.
총 비용의 관점에서 볼 때 "무료"R은 엄청나게 과장된 신화입니다. 데이터를 입력하고 출력을 형식화하기 위해 진지한 프로젝트를 수행하려면 사용자 지정 코드가 필요하며 이는 전문적인 시간의 비용이 아닙니다. 이 데이터 입력 및 형식화에 10 시간의 SAS 코드와 20 시간의 R 코드가 필요한 경우 , 경제학자가 말하듯이 주어진 기능을 생성하는 추가 비용 측면 에서 R은 더 비싼 소프트웨어 입니다. . 큰 프로젝트가 동일한 기능을 제공하기 위해 200 시간의 R 프로그래머 시간과 100 시간의 Stata 프로그래머 시간이 필요한 경우, Stata는 전체적으로 저렴합니다구매해야 할 ~ $ 1K 라이센스도 계산할 수 있습니다. 그러한 직접적인 비교를 보는 것이 흥미로울 것입니다. 나는 약 10 명의 사람-년에 걸쳐 약 150K의 Stata 코드로 누적 된 것으로 알려진 2Mb의 SPSS 코드를 엄청나게 재 작성하는 데 관여했다. 그것은 약 1 인년 프로젝트였습니다. SPSS : Stata 비교에서이 10 : 1 효율 비율이 일반적인지 잘 모르겠지만, 그 사실에 놀라지 않을 것입니다. 나에게 R을 사용하는 것은 검색 비용 때문에 항상 큰 비용이 든다. 비슷한 이름을 가진 5 가지 패키지 중 내가해야하는 일을 결정하고 그것이 그것을 사용할 수있을만큼 충분히 신뢰할 수 있는지 측정해야한다 내 작품. 그것은 종종 주어진 작업에서 R을 작동시키는 방법을 알아내는 데 소비 할 수있는 짧은 시간 안에 자신의 Stata 코드를 작성하는 것이 저렴하다는 것을 의미합니다. 이것이 나의 개인적인 특질임을 이해해야한다. 이 사이트의 대부분의 사람들은 나보다 더 잘 사용합니다.
"R은 경제학자가 작성하지 않았기 때문에"교수가 R보다 Stata 또는 GAUSS를 선호한다는 것이 유감입니다. Stata 나 GAUSS도 아니었다. 그들은 컴퓨터 과학자의 도구를 사용하여 컴퓨터 과학자에 의해 작성됩니다. 전문가가 CodeAcademy.com에서 프로그래밍에 대한 아이디어를 얻는다면 그보다 더 나을 것이지만, 전문가 급 소프트웨어 개발은 CodeAcademy.com 텍스트 상자에 입력하는 것과 다릅니다.화물 트럭 운전은 자전거와 다릅니다. (Stata는 노동 계량 경제학자로 전환 한 컴퓨터 과학자에 의해 시작되었지만, 현재까지 약 25 년 동안이 노동 계량 측정을 수행하지는 않았습니다.)
업데이트 : AndyW가 아래에 언급했듯이 모든 언어로 끔찍한 코드를 작성할 수 있습니다. 그러면 비용 문제는 어떤 언어를 쉽게 디버깅 할 수있게됩니까? 나에게 이것은 출력이 얼마나 정확하고 유익한 지, 구문 자체가 얼마나 쉽고 투명한지의 조합처럼 보입니다. 물론 나는 그것에 대한 좋은 대답이 없습니다. 예를 들어, 파이썬은 코드 들여 쓰기를 시행하는 것이 좋습니다. Stata 및 R 코드는 괄호로 접을 수 있으며 SAS에서는 작동하지 않습니다. 서브 루틴을 사용하는 것은 양날의 칼입니다. R에서 *apply()
애드혹을 사용하는 function
것은 분명히 매우 효율적이지만 디버그하기는 어렵습니다. 비슷한 토큰으로 Stata local
는 거의 모든 것을 마스킹 할 수 있으며, 빈 문자열을 기본값으로 사용하는 것도 유용하지만 캐치하기 어려운 오류가 발생할 수 있습니다.