통계 소프트웨어 사용에서 수학 방정식 이해로의 전환?


12

문맥:

저는 심리학 박사 과정 학생입니다. 많은 심리학 박사 과정 학생들과 마찬가지로 저는 통계 소프트웨어를 사용하여 PCA, 분류 트리 및 군집 분석과 같은 기술까지 다양한 통계 분석을 수행하는 방법을 알고 있습니다. 그러나 분석을 한 이유와 지표의 의미를 설명 할 수는 있지만 기술이 어떻게 작동하는지 설명 할 수 없기 때문에 실제로 만족스럽지 않습니다.

실제 문제는 통계 소프트웨어 마스터 링이 쉽지만 제한적이라는 것입니다. 기사에서 새로운 기술을 배우려면 수학 방정식을 읽는 방법을 이해해야합니다. 현재 고유 값 또는 K- 평균을 계산할 수 없습니다. 방정식은 나에게 외국어와 같습니다.

질문:

  • 저널 기사의 방정식을 이해하는 데 도움이되는 포괄적 인 가이드가 있습니까?

편집하다:

나는 그 질문이 더 자명 할 것이라고 생각했다. 특정한 복잡성보다 통계적 표기법은 나에게 횡설수설이된다. 기술을 이해하기 위해 R 또는 C ++로 자신의 함수를 코딩하고 싶지만 장벽이 있다고 가정 해 봅시다. 방정식을 프로그램으로 변환 할 수 없습니다. 그리고 실제로 : 나는 미국 박사 과정의 상황을 알지 못하지만, 나의 프랑스 (프랑스)에서 내가 따라갈 수있는 유일한 코스는 약 16 세기 문학 운동입니다 ...


@Coronier 죄송합니다. 통계 모델링을 사용하는 심리학 기사를 이해하기위한 포괄적 인 가이드가있을 것입니다. 그러나 필요한 배경은 모두 통계학 석사 학위 수준이어야합니다. 프로그램에서 비용을 지불하면 통계에서 MA를 얻는 것을 고려하십시오. 귀하의 목적에 가장 적합한 다음 옵션은 통계 부서의 다변량 통계 버전을 다시 취하는 것입니다. 일반적으로 PCA, 군집, 나무 등에 대한 수학적 배경을 가진 메모를 제공합니다. 선형 대수 및 기본 수학적 배경이 필요합니다. 통계에 관계없이
잠금 해제

더 구체적인 질문을하십시오.

4
나는 또한 심리학 박사 학위 학생이며, PCA (예 : PCA) 계산 방법을 모르는 심리학 박사 학위가 많기 때문에 학부 시절에 상당한 양의 수학을 선택했습니다. 가장 먼저해야 할 일은 괜찮은 선형 대수 교과서를 통해 작업하는 것입니다. 괜찮은 선형 대수 교과서가 무엇입니까? Gilbert Strang 's는 폭탄이며, MIT 웹 사이트에서 부팅 할 선형 대수 과정에 대한 비디오 강의를하고 있습니다. iTunes에서 구할 수도 있습니다.
Phillip Cloud

1
질문은 너무 광범위하여 몇 단락에서 만족스러운 답변을 얻지 못할 것입니다. 통계는 질문과 같습니다. 관리 가능한 여러 구성 요소로 분류하면 더 쉬워집니다.
Fr.

위의 의견에만 동의 할 수 있습니다. 특정 문제에 중점을 두어야하거나 먼저 일부 교과서 나 온라인 유인물을 검토해야합니다. 다변량 통계에 대한 기본 개념을 삽화로 다루는 적절한 교과서는 Carroll and Green (AP, 1997, Rev. Ed.)의 응용 다변량 분석을위한 수학 도구입니다 . 다른 하나는 Tinsley and Brown의 AP ( Applied Multivariate Statistics and Mathematical Modeling )이다 (AP, 2000).
chl

답변:


9

개요 :

  • 제 경험은 당신의 경험이 사회 과학에 많은 학생들에게 공통적이라는 것입니다.
  • 출발점은 학습 동기입니다.
  • 독학 또는 공식 교육 경로 로 내려갈 수 있습니다 .

공식 교육 :

이와 관련하여 많은 옵션이 있습니다. 통계학 석사 또는 통계 부서에서 몇 과목을 고려할 수 있습니다. 그러나 필요한 수학적 배경이 있는지 확인하고 싶을 것입니다. 과정에 따라 대학 수준의 수학적으로 엄격한 통계 과목을 다루기 전에 미적분 수학과 수학 및 선형 대수와 같은 자료를 다시 방문해야 할 수도 있습니다.

독학

또는 자율 학습 경로를 내려갈 수도 있습니다. 인터넷에는 훌륭한 자료가 많이 있습니다. 특히 수학 교과서에서 읽고 연습하는 것이 중요하지만 아마도 충분하지는 않습니다. 수학에 대해 이야기하는 강사의 말을 듣고 문제를 해결하는 것을 보는 것이 중요합니다.

또한 수학 목표와 이러한 목표를 달성하는 데 필요한 수학 전제 조건에 대해 생각하는 것이 중요합니다. 방정식이 외국어와 같다면 먼저 초등 수학을 공부해야 할 수도 있습니다.

통계 소프트웨어 사용에서 기초 수학 이해로 전환하는 사람들을 돕기위한 몇 가지 리소스를 준비했습니다.

  • 비디오 : 무료 온라인 수학 비디오 목록 -이 게시물은 미적분학에서 시작하여 미적분학, 선형 대수학, 확률 및 수학 통계를 통해 작업하는 적절한 수학 시퀀스가 ​​무엇인지에 대한 지침을 제공합니다. 또한 수학 통계 비디오 에 대한이 질문을 참조하십시오 .
  • 읽기와 발음 -첫 번째 과제 중 하나는 수학 방정식을 발음하고 읽는 방법을 배우는 것입니다. 나는 비 수학자를위한 수학을 읽기위한 팁발음 에 관한 두 개의 글을 썼습니다 .
  • 작문 -수학 쓰기 학습은 수학 읽기에 도움이 될 수 있습니다. LaTeX를 배우고 LaTeX의 수학에 대한 가이드를 확인하십시오
  • : 수학 학습에 관해서는 좋은 교과서에 투자 할 가치가 있다고 생각합니다. 그러나 요즘 에는 무료 온라인 옵션 이 많이 있습니다.

감사합니다. 제공하는 리소스가 훌륭합니다. Btw, 귀하의 블로그는 완전히 흡수됩니다 (저는 I / OP 학생이며 useR입니다. 그것은 나를위한 계시와 같습니다).
Coronier

@Coronier R과 I / O Psych를 결합한 다른 사람을 만나는 것이 좋습니다.
Jeromy Anglim

3

R 또는 C ++로 프로그래밍하여 통계 방정식에 대한 통찰력을 얻을 수 있다고 생각합니다. 당신은 할 수 없습니다. 통계 방정식을 이해하려면 각 장 끝에 방정식이 포함 된 숙제 문제가 많은 "학부생"교과서를 찾은 다음 방정식이 포함 된 장 끝에 숙제를 수행하십시오.

예를 들어 PCA를 이해하려면 선형 대수, 특히 특이 값 분해에 대한 이해가 필요합니다. Michael Nielsen의 책을 통해 양자 컴퓨팅을 배우는 동안 선형 대수학을 검토해야한다는 것이 분명해졌습니다. 나는 Gilbert Strang의 비디오를 보았고 개념에 대한 기본적인 이해를 확립하는 데 큰 도움이되었습니다. 그러나 자료의 뉘앙스는 많은 숙제 문제가 포함 된 선형 대수 서적을 발견 한 다음까지해야했습니다.


4
@ schenectady 내가 당신의 관점에 동정하는 동안, 적어도 나에게 R 코드는 관련된 방정식과 수학에 대한 나의 이해를 높이는 데 사용할 수있는 다리를 제공합니다. 즉, 문제, 통계 및 수학의 필요성에 전적으로 동의한다는 것은 전적으로 배울 수있는 것입니다.
richiemorrisroe

2

나는 통계에서 새로운 것을하려고 할 때 비슷한 문제가 있기 때문에 어려움을 이해합니다 (저는 또한 대학원생이지만 다른 분야에 있습니다). R 코드를 검사하면 무언가 계산 방법에 대한 아이디어를 얻는 데 매우 유용하다는 것을 알았습니다. 예를 들어, 최근에 kmeans클러스터링 을 사용하는 방법을 배우고 있으며 개념과 구현 방법에 대한 많은 기본적인 질문이 있습니다. 사용하여 R설치 (I 추천 R Studio, http://www.rstudio.org/ , 그러나 어떤 설치가 작동)을 바로 입력 kmeans명령 줄에 로그인합니다. 다음은 출력 의 일부 예입니다 .

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

매번 소스를 조사하는 것이 얼마나 실용적인지 잘 모르겠지만 구문에 익숙하다고 가정하면 실제로 진행 상황을 파악하는 데 도움이됩니다.

내가 stackoverflow 에 대해 물었던 이전 질문 은이 방향으로 나를 지적했지만 코드에 대한 의견이 때로는 여기에 포함되어 있다고 나에게 도움이 되었다 .


좀 더 일반적으로, 통계 소프트웨어 저널은 이론과 구현 사이의이 연결을 보여 주지만, 종종 고급 주제 (개인적으로 이해하기 어려운)에 관한 것이지만, 예로서 유용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.