사회 과학에서 학부 입문 통계 과정을 가르치는 데 적합한 통계 소프트웨어는 무엇입니까?


11

사회 과학 연구 프로그램에 대한 입문 통계 과정에서 사용할 수있는 통계 소프트웨어 패키지를 찾고 있습니다. 학생들은 통계에 대한 사전 지식이없고 프로그래밍 언어에 대한 경험이 없습니다. 목표는 기본 통계 개념 (평균, 분산, 제곱합, p- 값 등)과 선형 회귀 분석을 소개하고 예제 데이터 세트를 사용하여 자체적으로 기본 분석을 수행 할 수 있도록하는 것입니다. 이 과정은 수식을 암기하는 대신 통계를 수행하여 개념을 학습하는 것이어야합니다 (수식은 중요하다고 생각하지만).

따라서 일반적인 구문 (일반 R) 또는 포인트 앤 클릭 (SPSS 또는 Rcmdr) 구동 소프트웨어에 대한 대안을 찾고 있습니다. 이 소프트웨어는 쉽게 배울 수 있어야하며 데이터 세트를 시각화하고 표준 그래프와 테이블을 제공하는 명확한 그래픽 사용자 인터페이스를 가져야합니다. 분석의 모든 다른 단계 (예 : 데이터 읽기 및 조작, 설명 측정 계산, 설명 테이블 및 그래프 작성, 추론 측정 계산, 추론 그래프 플로팅, 보고서로 내보내기)를 시각화하는 것이 가장 좋습니다.

통계를 배우고 처음 연습하는 데 적합한 (오픈 소스 또는 무료) 통계 소프트웨어에 대한 제안이 있습니까?

편집
귀하의 제안에 감사드립니다. 나는로 보았다 gretl , 다른 두 용 프로그램은 내 자신의 온라인 질문 중에 발견 : RapidMiner통계 연구소 . [1]
나는 것으로 나타났습니다 gretl의 인터페이스와 출력이 더 명확하고 예를 들어 Rcmdr, SPSS 또는 STATA보다 초점을 맞추었다. 그러므로 그것은 내 관점에서 통계를 가르치기위한 훌륭한 도구입니다.
그러나 플로우 차트 GUI RapidMinerStatistical Lab통계 분석의 단일 단계 (데이터로드로 시작)를 시각화 할 때 감동했습니다. 나는 이것이 수학적 설명에 일반적인 초점을 맞추는 데 어려움을 겪는 많은 학생들에게 도움이 될 것이라고 생각합니다. 물론 RapidMiner는 초보자를위한 기능, 메뉴 및 버튼으로 너무 과부하 된 것처럼 보이지만 통계 연구소는 훨씬 집중되어 있습니다. Statistical Lab의 큰 장점은 Statistical Lab이 계산에 의존 할 때 실제 R 구문을 생성하는 데 도움이되는 "R 코드 마법사"가있는 콘솔과 유사한 "R-Calculator"입니다 R.
마지막으로, 나는 첫 번째 학기 통계 연구소 에서 시작 하여 기본 개념을 소개 하고 두 번째 학기에서 RStudio (및 Rcmdr)로 전환하기로 결정했습니다 .

[1] : Gnumeric, SciPy, Scilab, GNU Octave 등은 사회 과학에 덜 익숙한 것 같습니다.


8
@Matthias : 학생들이 사회 과학 분야를 오가거나 목표로한다면 통계의 첫 단계로 R을 가르치는 것은 과잉이라고 생각합니다. 대부분 콘솔, 명령, 구문 등의 개념에 문제가 있으며 "통계"보다 "프로그래밍 개념"( '함수', '루프'등)을 진행하는 데 더 많은 시간을 할애합니다. Soc.Science 부서에서 Stats 101에 대한 자습서를 수행했을 때이를 이전 경험을 바탕으로합니다. 강의의 요점을 놓친 사람들은 실제로 데이터를 탐색하는 것보다 R이 자신을 위해 일하도록하는 데 더 집중했습니다.
usεr11852

1
@ user11852 : 당신이 옳을 수도 있지만, 고등학교가 프로그래밍 노출없이 학생들을 보내주는 것은 슬픈 일입니다. 또는 이러한 차이를 허용하는 대학. 루프 나 기능이 무엇인지 모르는 대학 수업에 오는 학생은 없어야합니다. 노출을 지연 시키면 다른 곳에서 문제가 발생합니다.
curious_cat

2
@ user11852 : 또 다른 덜 맛좋은 옵션은 Satistics 부서가 "통계 과학에 대한 통계 101"클래스에 프로그래밍 경험이 필요하거나 프로그래밍에 대한 교정 클래스가 있다고 주장하는 것일 수 있습니다. 요즘 거의 모든 과목이 계산이 너무 치우치면 Programming-101이 모든 사람이 가장 먼저받는 수업이되어서는 안될 이유가 없습니다.
curious_cat

6
가치있는 것을 위해, 나는 정치 과학을위한 입문 통계 과정에서 R을 성공적으로 사용했다. RStudio 사용 했습니다 . 또한 학생들이 작은 과제에 대해 함께 일할 수 있도록 매주 "실험실"을 가지고 있었고 질문에 대답했습니다. 잘 짜여진 예제 코드를 통해 학생들은 잘 불평하지 않았습니다. 그들은 Stata를 사용할 때 이전 학기보다 실제로 R에 대해 훨씬 덜 불평했습니다. Stata는 무료가 아니기 때문에 학생들은 실험실 업무 시간 동안 들어 와서 일을해야했습니다.
Jason Morgan

6
R은 RStudio와 함께 훌륭한 접근 방법이 될 수 있다고 생각합니다. 또한 메뉴 시스템과 달리 재현 가능한 연구 관행의 무대를 설정합니다. 학생들이 웹에서 RStudio에로드 할 수있는 몇 가지 코드 템플릿을 제공하는 것이 좋습니다 (RStudio는 이것을 쉽게 만듭니다) 학생들이 변수 이름과 통계 모델을 당면한 문제에 필요한 것으로 변경하는 작업을 할 수있게하십시오.
Frank Harrell

답변:


12

아마 그레 틀? http://gretl.sourceforge.net/

그것은 학부 통계를 위해 우리 대학에서 무료로 사용됩니다.


9
+1. 훌륭한 제안. 나는 항상 Gretl의 GUI가 직관적이고 요점과 그 피드백이 정확하고 너무 많은 프릴을 제공하여 "기술적 인"학생들을 덜어 줄 것이라고 생각했습니다. 또한 무료이며 잘 문서화되어 있으며 누군가가 조금 더 깊은 것을 보려고 기울이면 R 콘솔이 있습니다.
usεr11852

8

Matlab , Maple , Mathematica , JMP , SAS 또는 Minitab 과 같은 "유명한"것들을 피할 수 있습니다. 왜냐하면 학생들이 졸업 할 때 전문적으로 사용하려면 매년 수천 달러를 지불해야하기 때문입니다. 각 회사는 자신이 좋아하는 도구를 사용하는 경향이 있으며, 회사가 비용을 지불하지 않는 도구를 가르치면 해당 기술이 낭비됩니다. 또한 독점 라이브러리가 마음에 들지 않습니다. 사용자가 버튼을 누르도록 훈련 시키며 사용자가 다른 곳 (JMP 등)으로 가고 싶다면 학습 수행이 없습니다.

SciPy / NumPy를 포함하는 파이썬 은 꽤 좋습니다. 오픈 소스이며 잘 지원됩니다. 배우기 쉽고 쉬운 문법이 있습니다. 그것은 여전히 ​​비명을 지르지 않기 때문에 해석되지만, 스크립팅이나 스프레드 시트를 모르면 필요 이상으로 훨씬 빠릅니다. PythonXY 는 좋은 버전이며 좋은 라이브러리와 지원을 제공합니다. 또한 GUI 프로그래밍도 가능합니다. Windows에서 독립형 응용 프로그램을 작성하는 것은 약간 어렵지만 학생 수준보다 훨씬 높습니다. (편집) 세이지사이 썬파이썬의 가치 제안을 크게 향상시킵니다. 인터페이스 및 유용성이 크게 향상되었습니다. 꽤 잘 해석 된 코드보다 1000 배 빠른 컴파일 된 코드는 나에게 훌륭하거나 놀랍습니다. 편집 : 나는 Anaconda (일명 conda) 배포판을 사용하여 재미를 보았으며 사용하기도 매우 간단합니다.

나는 Perl 의 열렬한 팬이 아니다 . 조금 구식입니다. 수학 / 과학보다 텍스트를 파싱하고 처리하는 것입니다. 잘못 이해하지 마십시오. 수학 / 과학은 할 수 있지만 VBA를 알고 있다면 MSWord는 수학 / 과학을 할 수 있습니다. 똑같이 할 수 없다는 것은 일차적 인 관심사로서 특정한 일을하는 것입니다.

R 은 수학 / 통계학 분야의 자격을 갖춘 PhD가 적극적으로 개발하고 있기 때문에 당신이하지 않더라도 R을 좋아 합니다. 즉, 문법에 문제가있을 수 있지만 최신 라이브러리가 있으며 오류가없는 것으로 입증 된 라이브러리를 갖게됩니다. (일반적으로)

엑셀 은 나쁜 시작이 아닙니다. 스프레드 시트를 알고 나면 다른 스프레드 시트를보다 쉽게 ​​사용할 수 있습니다. 비즈니스 환경에서 거의 모든 회사에 MicroSloth 사무소가 있으므로 Excel은 나쁜 생각이 아닙니다. 나는 그들의 스크립팅을 좋아하지 않지만 그것은 단지 선호이며, 여전히 그것을 사용할 수 있습니다. 다른 소프트웨어의 경우 5,000 달러에 비해 약 150 달러의 비용이 들기 때문에 일반인의 입장 비용이 더 합리적입니다.

JMP 스크립트 언어는 외계인입니다. 다른 (SAS 이외의) 소프트웨어로 변환되지 않습니다. 멀리하십시오. 이 언어의 상환 가능한 기능은 "R"코드를 실행할 수 있다는 것입니다. "R"로 코딩하는 경우 "R"및 "RStudio"를 사용하십시오.

MathCAD를 사용하지 않았 으므로 관련성을 말할 수 없습니다. 외부 데이터 가져 오기에 대해서는 더 상징적이라고 생각합니다. 지금까지는 더 저렴합니다. 자유롭고 개방적이지 않습니다. 시설은 다른 언어로 시설로 번역되지 않습니다. ( 편집 ) 또한이 범주에는 EES 가 있는데, 이는 매우 좁은 사용 범위를 벗어난 인상을받지 않습니다.

편집 : 나는 LabVIEW에 약간 감동했습니다 . 몇 시간 동안 누군가의 능력을 발휘할 수있을 정도로 간단합니다. 문자 그대로 정확히 동일한 ( MathScript ) 코드에 대해 MatLab보다 문자 그대로 1000 배 더 빠릅니다 . 무거운 물건을 가지고 있다면 약간의 가치가 있습니다. 그것은 돈이 들지 만 기존 대철의 1/5 근처에 있습니다.

행운을 빌어 요

편집 : 나는 언어에 대해 "영어"를 선택하더라도 독일어로 나오고 Windows 7에서 제거되지 않기 때문에 통계 실험실을 사용하지 않을 것입니다. 나는 그것을 작동시킬 수 없으며 그것을 제거하려고 시도했을 때 실패했습니다.

시행 착오로 메뉴 설정이 영어로 표시되도록 발견했습니다. 데이터 처리 및 표시를 위해 일부 R 라이브러리에 대한 비교적 간단한 (따라서 유용하고 일관된) 인터페이스 인 것 같습니다. 더 자세히 살펴 봐야하므로이 시점에서 '배심원은 아직 없습니다.'

더 편집 :

-> 여기 <- 는 툴과 워크 벤치에 대한 다른 모든 토론에 대한 재미있는 링크입니다.


2
파이썬 라이브러리 인 RPy rpy.sourceforge.net , R 도 있으므로 , 파이썬의 구문 적 단순성을 통해 R의 최신의 오류없는 측면을 얻을 수 있습니다.
Ghillie Dhu

1
"그들은 사용자가 버튼을 누르도록 훈련 시키며, 사용자가 다른 곳 (JMP 등)으로 가고 싶다면 학습이 이월되지 않습니다." 독점 프로그램 인 SAS는 "푸시 버튼"에 대해 특히 잘 훈련되지 않으며, 다른 언어들 사이에서 전달하는 데 어려움을 겪는 것은 독점 소프트웨어의 특징이 아닙니다. 도대체 저는 Python에서 R보다 SysStat에서 JMP로 더 많이 가고있었습니다.
Fomite

@Epigrad-엔지니어가 항상 두뇌를 끄는 것을 봅니다. 수십 및 수십 명의 사람들. 나는 당신이 그것의 유용성을 발견하게되어 기쁘지만, 당신이 이상치이며 일반적인 해로운 경향이 당신의 경험에 의해 크게 바뀌지 않을 것을 강력히 기대합니다.
EngrStudent

@EngrStudent : 통계 실험실을 이용해 주셔서 감사합니다! 영어의 메뉴 설정은 실제로 직관적이지 않지만 한 번 설정하면 언어에 더 이상 문제가 발생하지 않습니다. 불행히도, "R-Graph Wizard"를 작동시킬 수는 없지만, R 코드를 넣으면 정상적인 R-Graph가 제대로 작동합니다. 따라서 학생들에게 기본 그래픽을 생성하는 예제 코드 스 니펫을 제공합니다. 어쩌면 이전에 RStudio로 전환했을 수도 있습니다.
non-numeric_argument

1

스프레드 시트를 잘 생각하는 Gnumeric을 사용해 볼 수 있으며 Open Office 스프레드 시트도 있습니다. 스프레드 시트, 특히 Excel에서 스프레드 시트를 사용하는 데 따른 함정에 대해 설명합니다. 대학 이후 실제 생활에서 SPSS와 같은 사치가 없을 수도 있지만 수학 및 프로그래밍 기술을 요구하지 않는 무료 제품을 통해 유용한 서비스를받을 수 있습니다. . 많은 사무실 환경에는 기본적으로 Excel이 포함되어 있습니다.

살펴보십시오 :

http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d#- 통계 및 Excel 2007

다음과 같은 유사한 참조를 검색하십시오.

http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=ko#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). 9 가지 통계 소프트웨어 패키지의 신뢰성에 대한 비교 연구. 전산 통계 및 데이터 분석, 51, 3811–3831.


1

나는 CalEst였습니다 . 라이센스는 10 달러처럼 저렴하며 학생들이 연습 할 수있는 훌륭한 시뮬레이션 / 활동뿐만 아니라 계산 / 그래픽을 제공합니다. 또한 웹 사이트에는 주로 배포판에 유용한 도구가 있습니다.


이 답변은 약간 짧습니다. 이 소프트웨어를 제안하는 이유와 경쟁 제품과 비교했을 때 어떤 이점이 있습니까?
kjetil b halvorsen

1

우리는 Rguroo를 사용하기 시작했습니다. 이 소프트웨어는 새로 출시되었습니다. R 기반이지만 R 코딩에 대한 지식이 필요하지 않습니다. 또한 웹 응용 프로그램이므로 브라우저에서 간단히 로그인하면됩니다. 학생들은 어느 단계에서나 작업을 저장하고 다시 작업을 완료 할 수 있습니다. 그래픽 사용자 인터페이스는 매우 직관적이며 출력은 좋아 보입니다.


0

우리는 지난 3 년 동안 Fullerton의 California State University에있는 입문 통계 과정에서 Rguroo 베타 버전을 사용하고 있습니다. 그들은 지금 (2019 년 8 월) 공식 버전을 발표했습니다. https://Rguroo.com. 이것은 모든 브라우저에서 작동하는 웹 응용 프로그램 통계 소프트웨어입니다. 이 소프트웨어는 교육용으로 설계되었으며 교수진을위한 일대일 데모 및 교육을 제공합니다. 이메일을 보내거나 전화를 걸어 데모를 준비하십시오. 소프트웨어는 백그라운드에서 R을 실행하지만 R을 알 필요는 없습니다. 모든 포인트 앤 클릭입니다. 자세한 출력, 훌륭한 그래픽 도구, 확률 계산기 및 시뮬레이션 도구를 포함하여 많은 훌륭한 기능을 가지고 있습니다. 나는 모든 단계에서 작업을 저장하고 돌아와서 중단 한 곳에서 계속할 수있는 재현성 기능을 특히 좋아합니다. RGR 파일이라고하는 것을 통해 학생들과 작품을 공유 할 수도 있습니다. 결론은 ... 그것은 훌륭하고 우리는 그것을 계속 사용합니다.


0

저는 개인적 으로 통계 교육을 위해 DataMelt 소프트웨어 를 사용 합니다. 매우 잘 문서화되어 있으며 튜토리얼, 서적 및 많은 예제가 있습니다. 또한 중요한 것은 모든 예제를 검색 할 수 있고 합리적인 답변을 얻을 수 있다는 것입니다 (Javadoc 및 코드 스 니펫). 학생들은 Python (기본 프로그래밍 언어)뿐만 아니라 Java로 통계 방법을 코딩하는 방법을 배울 수 있습니다. 제 생각에는 이것이 중요한 강점입니다. 학생들은 R-stat와 같은 매우 특수한 "통계적"언어를 배울 필요가 없습니다. 또한 동시에 Java를 배울 수 있으므로 업계에 가기로 결정하면 많은 기회를 열 수 있습니다.


-1

웹 응용 프로그램 인 Rguroo라는 새로운 소프트웨어가 있습니다. 다운로드 나 설치가 필요하지 않으므로 사용이 매우 편리합니다. Rguroo에는 R 엔진이 있지만 포인트 앤 클릭 그래픽 인터페이스를 사용하여 R의 성능을 사용할 수 있으므로 R 코딩이 필요하지 않습니다. 모든 분석은 저장 가능하고 재현 가능합니다. 우리는 지난 3 년 동안 소개 및 중간 통계 과정에이 소프트웨어를 사용해 왔습니다. 이 시점에서 무료이며 www.Rguroo.com에서 계정을 만들 수 있습니다. 내가 가지고있는 정보를 바탕으로 모든 교수진에게 무료로 제공되며 학생에게는 10-20 달러 정도의 저렴한 연회비가 부과됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.