통계 및 빅 데이터 hypothesis-testing

3

그래서 다른 결과를 바탕으로 한 통계 테스트를 선택하는 것은 좋지 않다고 들었습니다. 그래도 나에게는 이상해 보인다. 예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. …

13 hypothesis-testing

3

여러 차원에서 균일 성을 테스트하는 방법은 무엇입니까?

균일 성을 테스트하는 것이 일반적이지만, 다차원적인 점 구름에 대해 어떤 방법을 사용하는지 궁금합니다.

13 hypothesis-testing uniform

3

단측 테스트와 양측 테스트의 차이점은 무엇입니까?

통계 과정을 공부하면서 한쪽 꼬리와 양쪽 꼬리 가설 검정의 차이점을 이해하려고했습니다. 구체적으로, 왜 단측 테스트가 널을 거부하고 양측 테스트는 널을 거부합니까? 예를 들면 :

13 hypothesis-testing

2

데이터 샘플이 감마 분포 제품군에 적합한 지 테스트하는 방법은 무엇입니까?

연속 랜덤 변수 X에서 생성 된 데이터 샘플이 있습니다. R을 사용하여 그린 막대 그래프에서 X의 분포가 특정 감마 분포를 따르는 것 같습니다. 그러나 나는이 감마 분포의 정확한 매개 변수를 모른다. 내 질문은 X 분포가 감마 분포 군에 속하는지 테스트하는 방법입니다. Kolmogorov-Smirnov 검정, Anderson-Darling 검정 등과 같은 적합도 검정이 있지만 이러한 …

13 distributions hypothesis-testing goodness-of-fit gamma-distribution

2

통계적 유의성 테스트를 사용하여 군집 분석 결과 검증

클러스터 분석 결과를 검증하기 위해 통계적 유의성 테스트 (SST) 사용을 조사하고 있습니다. 이 주제와 관련하여 다음과 같은 여러 논문을 발견했습니다. " 높은 차원, 낮은 표본 크기 데이터에 대한 클러스터링의 통계 유의 사항 Fi를 cance 에 의해" 리우, Yufeng의 등. (2008) " 군집 분석의 일부 유의성 검정에서 ", Bock (1985) 그러나 …

13 hypothesis-testing clustering statistical-significance

1

스피어 맨 상관 계수의 차이에 대한 유의성 검정

(빠른 답변을 많이 주셔서 감사합니다! 질문을 잘 못해서 다시 시도하겠습니다.) 두 Spearman의 상관 관계의 차이가 통계적으로 유의한지 여부를 확인하는 방법을 모르겠습니다. 그것을 찾는 방법을 알고 싶습니다. 내가 알고 싶었던 이유는 Gabrilovich와 Markovitch의 위키 백과 기반의 자연 언어 처리 의미 론적 해석 ( Journal of Artificial Intelligence Research 34 (2009) 443-498) …

13 hypothesis-testing statistical-significance spearman-rho

5

카이 제곱을 사용하여 비율을 비교할 수 있습니까?

카이 제곱 테스트는 샘플이 예상 값 세트와 크게 다른지 확인하는 데 유용하다는 것을 읽었습니다. 예를 들어, 다음은 사람들이 선호하는 색상 (n = 15 + 13 + 10 + 17 = 55 총 응답자)에 대한 설문 조사 결과 테이블입니다. red,blue,green,yellow 15,13,10,17 카이 제곱 검정은이 표본이 각 색상을 좋아하는 사람들의 동등한 확률에 …

13 chi-squared hypothesis-testing proportion

1

올가미에 대한 LARS 대 좌표 하강

L1 정규 선형 회귀 피팅에 LARS [1] 사용과 좌표 하강 사용의 장단점은 무엇입니까? 나는 주로 퍼포먼스 측면에 관심이있다 (내 문제는 N수십만에서 p20 이하인 경향이있다 ). 그러나 다른 통찰력도 인정 될 것이다. 편집 : 내가 질문을 게시 한 후 chl은 Friedman 등의 논문 [2]에 좌표 하강이 다른 방법보다 상당히 빠른 것으로 …

13 regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

4

두 표본 분포의 꼬리 비교

대략 0을 중심으로하는 두 개의 데이터 세트가 있지만 꼬리가 다른 것으로 의심됩니다. 분포를 정규 분포와 비교하기위한 몇 가지 테스트를 알고 있지만 두 분포를 직접 비교하고 싶습니다. 두 분포의 꼬리의 비만을 비교 하는 간단한 테스트가 있습니까? 감사합니다 fRed

13 hypothesis-testing distributions kurtosis fat-tails

1

동일한 기울기의 null에 대해 두 개의 독립적 인 샘플을 테스트합니까?

귀무 가설이 같은 차이를 가진 모집단에서 나온 귀무 가설에 대해 두 개의 독립적 인 표본을 검정하기 위해 어떤 검정을 사용할 수 있습니까? 스큐가 고정 숫자와 같은지 여부에 대한 고전적인 1- 표본 테스트가 있습니다 (테스트는 6 번째 샘플 모멘트를 포함합니다). 2 샘플 테스트로 직접 변환합니까? 매우 높은 데이터 순간을 포함하지 않는 …

13 hypothesis-testing distributions bootstrap moments l-moments

1

GBM 패키지와 GBM을 사용하는 Caret

을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

13 r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

2

UMP가 없을 때 거부 영역을 정의하는 방법은 무엇입니까?

선형 회귀 모형을 고려하십시오. ,y = X β+ uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} ,u ∼N( 0 , σ2나 )u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) 입니다.이자형( u ∣ X ) = 0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} 대 H 1 : σ 2 0 ≠ σ 2로 하자 .H0: σ20= σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1: σ20≠ σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 y T M X y를 추론 할 수 있습니다, …

13 regression hypothesis-testing mathematical-statistics inference

2

n 번의 토스에서 k 개의 헤드를 관찰합니다. 동전은 공정합니까?

인터뷰에서 으로이 질문을 받았습니다 . "올바른"답변이 있습니까?( n , k ) = ( 400 , 220 )(n,k)=(400,220)(n, k) = (400, 220) 토스가 iid이고 헤드 확률이 가정합니다 . 400 토스에서 헤드 수의 분포는 보통 (200, 10 ^ 2)에 가까워 야 220 헤드가 평균에서 2 표준 편차 떨어져 있습니다. 이러한 결과를 관찰 …

13 probability hypothesis-testing self-study prior

4

두 표본의 평균이 크게 다르지만 차이가 너무 작아서 중요하지 않은 경우 수행 할 작업

두 개의 샘플이 있습니다 ( 두 경우 모두 ). 평균적으로 풀링 된 표준의 두 배가 다릅니다. dev. 결과 값은 약 10입니다. 평균이 같지 않다는 것을 결정적으로 보여 주 었음을 아는 것이 좋지만, 이것은 큰 n에 의해 구동되는 것 같습니다. 데이터의 히스토그램을 보면 작은 p- 값과 같은 것이 실제로 데이터를 대표한다고 …

13 hypothesis-testing t-test

3

공분산 행렬이 두 시점에 걸쳐 변경되었는지 테스트하는 방법은 무엇입니까?

내 임무는 6 변수의 공분산 행렬에 변화가 있는지 테스트하는 것입니다. 6 개의 변수 값은 동일한 주제에서 두 번 측정됩니다 (측정 사이 3 년). 어떻게해야합니까? SAS를 사용하여 대부분의 작업을 수행했습니다.

13 hypothesis-testing repeated-measures multivariate-analysis covariance-matrix

«hypothesis-testing» 태그된 질문