통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

5
대응 대 비대칭 t- 검정
내가 20 마리의 생쥐를 가지고 있다고 가정하자. 나는 어떤 방식으로 마우스를 페어링하여 10 쌍을 얻습니다. 이 질문의 목적 상, 무작위 짝짓기 일 수도 있고, 같은 쓰레기에서 같은 생쥐의 생쥐를 비슷한 체중으로 짝 짓는 것과 같은 합당한 짝짓기 일 수도 있고, 의도적으로 바보 같은 짝짓기 일 수도 있습니다. 가능한 한 무게가 …


2
Pearson의 상관 계수가 정규성 위반에 얼마나 강력합니까?
특정 집단에서 측정 할 때 특정 종류의 변수에 대한 데이터는 비정규 경향이 있습니다 (예 : 주요 우울 장애가있는 인구 집단의 우울증 수준). Pearson의 가정이 정규성을 가정하면 비정규 조건에서 검정 통계량은 얼마나 강력합니까? 상관 계수를 원하는 여러 변수가 있지만 이러한 변수 중 일부에 대한 Z-skewness는 p <.001 에서 중요 합니다 (상대적으로 …

3
배심원에 대한 기본 통계
배심원 의무로 소환되었습니다. 나는 배심원 재판과 통계의 관련성을 의식하고 있습니다. 예를 들어, "기본 요율"의 개념과 확률 계산에 대한 적용은 때로는 항상 관련이 있습니다. 내 상황에있는 사람이 어떤 통계적 주제를 유용하게 연구 할 수 있으며, 내 배경을 가진 사람에게 적합한 자료는 무엇입니까? 나는 "하드 과학"학위를 가지고 있기 때문에 통계 지식이 제한되어 …

2
여러 대치 후 후방 평균과 신뢰할 수있는 간격을 어떻게 모을 수 있습니까?
여러 대치를 사용하여 여러 개의 완성 된 데이터 집합을 얻었습니다. 완성 된 각 데이터 집합에 베이지안 방법을 사용하여 모수에 대한 사후 분포를 얻었습니다 (임의의 효과). 이 매개 변수의 결과를 어떻게 결합 / 풀링 할 수 있습니까? 더 많은 맥락 : 내 모델은 학교에 모인 개별 학생 (학생 당 한 번의 …

6
비 가우시안 데이터의 PCA
PCA에 대한 몇 가지 빠른 질문이 있습니다. PCA 는 데이터 세트가 가우스 인 것으로 가정 합니까 ? 본질적으로 비선형 데이터에 PCA를 적용하면 어떻게됩니까? 데이터 세트가 주어지면 프로세스는 먼저 평균 정규화, 분산을 1로 설정하고 SVD를 취하고 순위를 줄이고 마지막으로 데이터 세트를 새로운 감소 된 순위 공간에 매핑합니다. 새로운 공간에서 각 차원은 …
20 pca  svd 

2
주어진 전력 및 교차 스펙트럼 밀도에서 시계열 시뮬레이션
공분산 행렬 (PSD (Power Spectral Densities) 및 CSD (Cross-Power Spectral Density))을 감안할 때 고정 색상 시계열 세트를 생성하는 데 문제가 있습니다. I는 주어진 두 개의 시계열 알 와이나는( t )yI(t)y_{I}(t) 및 와이J( t )yJ(t)y_{J}(t) 많은 널리 사용과 같은 루틴을 이용하여, I가 전력 스펙트럼 밀도 (PSD를) 및 크로스 스펙트럼 밀도 (CSD가)를 …

4
베타 회귀에서 0.1 값 다루기
[0,1]에 베타 회귀 분석으로 분석하려는 데이터가 있습니다. 물론 0,1 값을 수용하려면 무언가를 수행해야합니다. 모델에 맞게 데이터 수정을 싫어합니다. 또한 나는 0과 1 인플레이션이 좋은 생각이라고 생각하지 않습니다.이 경우 0은 매우 작은 양수 값으로 간주해야한다고 생각하기 때문에 (그러나 나는 어떤 값이 적절한 지 정확하게 말하고 싶지 않습니다. .001 및 .999와 같은 …

6
“Fully Bayesian”대“Bayesian”
나는 베이지안 통계에 대해 배우고 있으며 종종 기사를 읽었습니다. "우리는 베이지안 접근 방식을 채택합니다" 또는 비슷한 것. 나는 또한 덜 자주 알아 차렸다. "우리는 완전히 베이지안 접근 방식을 채택합니다 " (내 강조). 실용적 또는 이론적 의미에서 이러한 접근 방식간에 차이점이 있습니까? FWIW, MCMCglmm관련이있는 경우 R에서 패키지 를 사용하고 있습니다.
20 bayesian 

3
R의 rollapply PCA에서 "점프"로딩을 받고 있습니다. 수정할 수 있습니까?
28 개의 다른 통화에 대한 10 년 간의 일일 반품 데이터가 있습니다. 첫 번째 주요 구성 요소를 추출하고 싶지만 10 년 전체에 PCA를 운영하는 대신 통화의 동작이 발전하고이를 반영하기 위해 2 년 창을 적용하고 싶습니다. 그러나 중요한 문제가 있습니다. 즉, princomp () 및 prcomp () 함수는 종종 인접한 PCA 분석에서 …
20 r  pca 

1
로지스틱 회귀 분석을위한 컴퓨팅 예측 간격
로지스틱 회귀 추정치에 대한 예측 간격 을 생성하는 방법을 이해하고 싶습니다 . Collett 's Modeling Binary Data , 2nd Ed p.98-99 의 절차를 따르는 것이 좋습니다 . 이 절차를 구현하고이를 R과 비교 한 후에 predict.glm실제로이 책은 예측 구간이 아닌 신뢰 구간 을 계산하는 절차를 보여주고 있다고 생각 합니다. 와 비교 …

2
하이퍼 파라미터 추정을위한 교차 검증 대 경험적 베이
계층 적 모델 주어지면 모델 에 맞는 2 단계 프로세스가 필요합니다. 먼저 소수의 하이퍼 파라미터 수정 한 다음 나머지 매개 변수 에 대한 베이지안 추론을 수행하십시오 . 하이퍼 파라미터를 고정시키기 위해 두 가지 옵션을 고려하고 있습니다.θ ϕp ( x | ϕ , θ )p(x|ϕ,θ)p(x|\phi,\theta)θθ\thetaϕϕ\phi 경험적 베이 (EB)를 사용 하고 한계 …

6
변수의 스케일을 0-100으로 변경
PCA 기술을 사용하여 소셜 자본 지수를 구성했습니다. 이 지수는 양수와 음수 값으로 구성됩니다. 해석하기 쉽도록이 인덱스를 0-100 스케일로 변환 / 변환하고 싶습니다. 가장 쉬운 방법을 제안하십시오.

2
베이지안 신뢰할 수있는 구간 절차에 대한 의사 결정 이론적 근거는 무엇입니까?
(내가 왜 이것을 썼는지 보려면 이 질문에 대한 내 답변 아래의 주석을 확인하십시오 .) 유형 III 오류 및 통계적 결정 이론 잘못된 질문에 대한 정답을 제공하는 것을 유형 III 오류라고도합니다. 통계적 의사 결정 이론은 불확실한 의사 결정의 공식화입니다. 유형 III 오류를 피할 수있는 개념적 프레임 워크를 제공합니다. 프레임 워크의 핵심 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.