«chi-squared» 태그된 질문

검정 (일반적으로 분포, 독립성 또는 적합도) 또는 그러한 검정과 관련된 분포 군입니다.

1
어떤 수준에서입니다
배경 : 안전하게 건너 뛰십시오-참조를 위해 여기 있으며 질문을 정당화합니다. 이 문서 의 시작 부분은 다음 과 같습니다. "Karl Pearson의 유명한 카이-제곱 비상 테스트는 정규 분포를 기반으로하는 z 통계라고하는 다른 통계량에서 파생됩니다. 가장 간단한 버전의 χ2χ2\chi^2 는 수학적으로 동일한 z 테스트와 동일한 것으로 표시 될 수 있습니다.이 테스트는 동일한 결과를 …

1
귀무 가설 하에서 교환 가능한 샘플의 직관은 무엇입니까?
순열 검정 (랜덤 화 검정, 재 랜덤 화 검정 또는 정확한 검정이라고도 함)은 매우 유용하며, 예를 들어 요구되는 정규 분포 가정이 t-test충족되지 않고 순위에 따라 값을 변환 할 때 유용합니다. 비모수 테스트 Mann-Whitney-U-test는 더 많은 정보가 손실 될 수 있습니다. 그러나 이러한 종류의 테스트를 사용할 때 단 하나의 가정 만 …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
분산에 대한 신뢰 구간을 생성 할 때 카이 제곱이 사용되는 이유는 무엇입니까?
이것은 매우 기본적인 질문입니다. 카이 제곱 분포를 사용하는 이유는 무엇입니까? 이 배포판의 의미는 무엇입니까? 이 분포가 분산에 대한 신뢰 구간을 만드는 데 사용되는 이유는 무엇입니까? 내가 설명은 구글 모든 장소는 카이를 사용하는 경우를 설명하지만, 설명하지,이 사실을 제시 하는 이유 카이를 사용하고,이 방법을 보이는 이유는 않습니다. 올바른 방향으로 나를 가리킬 수있는 …

4
기대 값과 가능한 값 (모드)
분포 의 예상 값은 f(x)f(x)f(x)평균입니다. 즉 가중 평균 값 E[x]=∫+∞−∞xf(x)dxE[x]=∫−∞+∞xf(x)dxE[x]=\int_{-\infty}^{+\infty} x \, \, f(x) dx 가장 가능성이 높은 값은 가장 가능성있는 값인 모드입니다. 그러나 우리는 어떻게 든 E[x]E[x]E[x] 를 여러 번 볼 것으로 예상 합니까? 여기 에서 인용 : 결과 xixix_i 가 똑같이 가능하지 않은 경우 단순 평균을 가중 평균으로 …

1
카이-제곱 기능 선택은 정확히 어떻게 작동합니까?
각 피처-클래스 쌍에 대해 카이-제곱 통계 값이 계산 되고 임계 값과 비교됩니다. 그래도 조금 혼란 스럽습니다. 피처와 클래스 가 있다면 우발성 테이블을 어떻게 구축합니까? 유지할 기능과 제거 할 기능을 어떻게 결정합니까?미디엄미디엄m케이케이k 어떤 설명이라도 대단히 감사하겠습니다. 미리 감사드립니다


1
감마와 카이 제곱 분포의 관계
만약 곳 , 즉 모든 동일한 분산과 평균 제로의 IID 정상 랜덤 변수이고, 그런 다음Y=∑i=1NX2iY=∑i=1NXi2Y=\sum_{i=1}^{N}X_i^2Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim \mathcal{N}(0,\sigma^2)XiXiX_iY∼Γ(N2,2σ2).Y∼Γ(N2,2σ2).Y \sim \Gamma\left(\frac{N}{2},2\sigma^2\right). 카이 제곱 분포가 감마 분포의 특수한 경우이지만 랜덤 변수 대한 카이 제곱 분포를 도출 할 수 없다는 것을 알고 있습니다. 도와주세요?YYY

1
Karl Pearson은 카이 제곱 통계량을 어떻게 얻었습니까?
Pearson은 1900 년에 다음과 같은 Pearson 카이 제곱 통계를 어떻게 얻었습니까? K=∑(Oij−Eij)2EijK=∑(Oij−Eij)2Eij K = \sum \frac{(O_{ij} -E_{ij})^2}{E_{ij}} that K∼χ2K∼χ2 K \sim \chi^2 그는 카이 제곱을 염두에두고 메트릭 KKK (하단 접근법)를 고안 했습니까, 아니면 통계를 고안 한 후 나중에 카이 제곱 분포 (위에서 아래로)를 따르는 지 증명 했습니까? 왜 그가 특정 …

2
제곱 정규 변수와 카이 제곱 변수의 컨벌루션 분포?
최근 데이터를 분석하는 중에 다음과 같은 문제가 발생했습니다. 랜덤 변수 X가 정규 분포를 따르고 Y가 χ2nχn2\chi^2_n 분포 (n dof 포함)를 따르는 경우 Z=X2+Y2Z=X2+Y2Z = X^2 + Y^2 는 어떻게 분포됩니까? 지금까지 나는 의 pdf를 생각해 냈습니다 . ψ 2 n ( x )Y2Y2Y^2ψ2n(x)====∂F(x−−√)∂x(∫x√0tn/2−1⋅e−t/22n/2Γ(n/2)dt)′x12n/2Γ(n/2)⋅(x−−√)n/2−1⋅e−x√/2⋅(x−−√)′x12n/2−1Γ(n/2)⋅xn/4−1⋅e−x√/2ψn2(x)=∂F(x)∂x=(∫0xtn/2−1⋅e−t/22n/2Γ(n/2)dt)x′=12n/2Γ(n/2)⋅(x)n/2−1⋅e−x/2⋅(x)x′=12n/2−1Γ(n/2)⋅xn/4−1⋅e−x/2\begin{eqnarray} \psi^2_n(x) &=& \frac{\partial F(\sqrt{x})}{\partial x} \\ &=& …

1
2 개의 경험적 이산 분포 간의 차이에 대한 검정
나는 경험적 분포로 사용하는 불연속 분포에서 여러 개의 큰 표본이있는 테스트 데이터를 가지고 있습니다. 분포가 실제로 다른지 여부와 실제로 다른 분포에 대한 평균의 차이점은 무엇인지 테스트하고 싶습니다. 그것들은 불연속 분포이기 때문에 기본적으로 지속적인 분포 가정 때문에 Kolmogorov-Smirnov 검정이 유효하지 않다는 것을 이해합니다. 카이-제곱 검정이 분포가 실제로 다른지 여부에 대한 올바른 …

2
많은 셀의 주파수가 5 미만인 경우 카이-제곱 검정의 적용 가능성
동료의 지원 (독립 변수)과 작업 만족도 (의존 변수) 사이의 연관성을 찾기 위해 카이 제곱 테스트를 적용하고 싶습니다. 동료의 지원은 지원 범위에 따라 네 그룹으로 분류됩니다. 1 = 매우 적은 범위, 2 = 일부, 3 = 대부분, 4 = 매우 업무 만족도는 두 가지로 분류됩니다 : 0 = 만족 및 1 …

3
폭탄은 어디에 있습니까? 행과 열의 총계가 주어지면 확률을 어떻게 추정합니까?
이 질문은 Pokemon Soulsilver의 미니 게임에서 영감을 얻었습니다. 이 5x6 영역에 15 개의 폭탄이 숨겨져 있다고 상상해보십시오 (편집 : 최대 1 개의 폭탄 / 셀). 이제 행 / 열 합계를 고려하여 특정 필드에서 폭탄을 찾을 확률을 어떻게 추정 할 수 있습니까? 열 5 (총 폭탄 = 5)를 보면 다음과 같이 …

5
카이 제곱을 사용하여 비율을 비교할 수 있습니까?
카이 제곱 테스트는 샘플이 예상 값 세트와 크게 다른지 확인하는 데 유용하다는 것을 읽었습니다. 예를 들어, 다음은 사람들이 선호하는 색상 (n = 15 + 13 + 10 + 17 = 55 총 응답자)에 대한 설문 조사 결과 테이블입니다. red,blue,green,yellow 15,13,10,17 카이 제곱 검정은이 표본이 각 색상을 좋아하는 사람들의 동등한 확률에 …

1
올가미에 대한 LARS 대 좌표 하강
L1 정규 선형 회귀 피팅에 LARS [1] 사용과 좌표 하강 사용의 장단점은 무엇입니까? 나는 주로 퍼포먼스 측면에 관심이있다 (내 문제는 N수십만에서 p20 이하인 경향이있다 ). 그러나 다른 통찰력도 인정 될 것이다. 편집 : 내가 질문을 게시 한 후 chl은 Friedman 등의 논문 [2]에 좌표 하강이 다른 방법보다 상당히 빠른 것으로 …

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.