«hypothesis-testing» 태그된 질문

가설 검정은 데이터가 임의 변동의 영향보다는 주어진 가설과 일치하지 않는지 여부를 평가합니다.

3
다른 결과에 기초한 통계 테스트 선택 (예 : 정규성)
그래서 다른 결과를 바탕으로 한 통계 테스트를 선택하는 것은 좋지 않다고 들었습니다. 그래도 나에게는 이상해 보인다. 예를 들어, 다른 테스트에서 잔차가 정규 분포를 따르지 않는다고 제안 할 때 비모수 적 테스트를 사용하는 경우가 종종 있습니다. 이 접근법은 꽤 널리 받아 들여져 있지만이 단락의 첫 번째 문장에 동의하지 않는 것 같습니다. …



2
데이터 샘플이 감마 분포 제품군에 적합한 지 테스트하는 방법은 무엇입니까?
연속 랜덤 변수 X에서 생성 된 데이터 샘플이 있습니다. R을 사용하여 그린 막대 그래프에서 X의 분포가 특정 감마 분포를 따르는 것 같습니다. 그러나 나는이 감마 분포의 정확한 매개 변수를 모른다. 내 질문은 X 분포가 감마 분포 군에 속하는지 테스트하는 방법입니다. Kolmogorov-Smirnov 검정, Anderson-Darling 검정 등과 같은 적합도 검정이 있지만 이러한 …

2
통계적 유의성 테스트를 사용하여 군집 분석 결과 검증
클러스터 분석 결과를 검증하기 위해 통계적 유의성 테스트 (SST) 사용을 조사하고 있습니다. 이 주제와 관련하여 다음과 같은 여러 논문을 발견했습니다. " 높은 차원, 낮은 표본 크기 데이터에 대한 클러스터링의 통계 유의 사항 Fi를 cance 에 의해" 리우, Yufeng의 등. (2008) " 군집 분석의 일부 유의성 검정에서 ", Bock (1985) 그러나 …

1
스피어 맨 상관 계수의 차이에 대한 유의성 검정
(빠른 답변을 많이 주셔서 감사합니다! 질문을 잘 못해서 다시 시도하겠습니다.) 두 Spearman의 상관 관계의 차이가 통계적으로 유의한지 여부를 확인하는 방법을 모르겠습니다. 그것을 찾는 방법을 알고 싶습니다. 내가 알고 싶었던 이유는 Gabrilovich와 Markovitch의 위키 백과 기반의 자연 언어 처리 의미 론적 해석 ( Journal of Artificial Intelligence Research 34 (2009) 443-498) …

5
카이 제곱을 사용하여 비율을 비교할 수 있습니까?
카이 제곱 테스트는 샘플이 예상 값 세트와 크게 다른지 확인하는 데 유용하다는 것을 읽었습니다. 예를 들어, 다음은 사람들이 선호하는 색상 (n = 15 + 13 + 10 + 17 = 55 총 응답자)에 대한 설문 조사 결과 테이블입니다. red,blue,green,yellow 15,13,10,17 카이 제곱 검정은이 표본이 각 색상을 좋아하는 사람들의 동등한 확률에 …

1
올가미에 대한 LARS 대 좌표 하강
L1 정규 선형 회귀 피팅에 LARS [1] 사용과 좌표 하강 사용의 장단점은 무엇입니까? 나는 주로 퍼포먼스 측면에 관심이있다 (내 문제는 N수십만에서 p20 이하인 경향이있다 ). 그러나 다른 통찰력도 인정 될 것이다. 편집 : 내가 질문을 게시 한 후 chl은 Friedman 등의 논문 [2]에 좌표 하강이 다른 방법보다 상당히 빠른 것으로 …

4
두 표본 분포의 꼬리 비교
대략 0을 중심으로하는 두 개의 데이터 세트가 있지만 꼬리가 다른 것으로 의심됩니다. 분포를 정규 분포와 비교하기위한 몇 가지 테스트를 알고 있지만 두 분포를 직접 비교하고 싶습니다. 두 분포의 꼬리의 비만을 비교 하는 간단한 테스트가 있습니까? 감사합니다 fRed

1
동일한 기울기의 null에 대해 두 개의 독립적 인 샘플을 테스트합니까?
귀무 가설이 같은 차이를 가진 모집단에서 나온 귀무 가설에 대해 두 개의 독립적 인 표본을 검정하기 위해 어떤 검정을 사용할 수 있습니까? 스큐가 고정 숫자와 같은지 여부에 대한 고전적인 1- 표본 테스트가 있습니다 (테스트는 6 번째 샘플 모멘트를 포함합니다). 2 샘플 테스트로 직접 변환합니까? 매우 높은 데이터 순간을 포함하지 않는 …

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

2
UMP가 없을 때 거부 영역을 정의하는 방법은 무엇입니까?
선형 회귀 모형을 고려하십시오. ,y = X β+ uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} ,u ∼N( 0 , σ2나 )u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) 입니다.이자형( u ∣ X ) = 0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} 대 H 1 : σ 2 0 ≠ σ 2로 하자 .H0: σ20= σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1: σ20≠ σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 y T M X y를 추론 할 수 있습니다, …

2
n 번의 토스에서 k 개의 헤드를 관찰합니다. 동전은 공정합니까?
인터뷰에서 으로이 질문을 받았습니다 . "올바른"답변이 있습니까?( n , k ) = ( 400 , 220 )(n,k)=(400,220)(n, k) = (400, 220) 토스가 iid이고 헤드 확률이 가정합니다 . 400 토스에서 헤드 수의 분포는 보통 (200, 10 ^ 2)에 가까워 야 220 헤드가 평균에서 2 표준 편차 떨어져 있습니다. 이러한 결과를 관찰 …

4
두 표본의 평균이 크게 다르지만 차이가 너무 작아서 중요하지 않은 경우 수행 할 작업
두 개의 샘플이 있습니다 ( 두 경우 모두 ). 평균적으로 풀링 된 표준의 두 배가 다릅니다. dev. 결과 값은 약 10입니다. 평균이 같지 않다는 것을 결정적으로 보여 주 었음을 아는 것이 좋지만, 이것은 큰 n에 의해 구동되는 것 같습니다. 데이터의 히스토그램을 보면 작은 p- 값과 같은 것이 실제로 데이터를 대표한다고 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.