«goodness-of-fit» 태그된 질문

적합도 검정은 랜덤 표본이 특정 분포에서 나온 것으로 가정하는 것이 합리적인지 여부를 나타냅니다.

1
단측 Kolmogorov-Smirnov 테스트를 수행하는 것이 이치에 맞습니까?
단측 KS 테스트를 수행하는 것이 의미가 있고 가능합니까? 그러한 검정의 귀무 가설은 무엇입니까? 아니면 KS 테스트는 본질적으로 양측 테스트입니까? 나는 날의 분포를 이해하는 데 도움 답변에서 도움이 될 D 예를 들어 있으며, 내가 메시의 1951 종이를 통해 일 오전 (와 도전에 대한 설명을 찾을 과 차이의 supremum 상하 한 경험적 …

1
귀무 가설 하에서 교환 가능한 샘플의 직관은 무엇입니까?
순열 검정 (랜덤 화 검정, 재 랜덤 화 검정 또는 정확한 검정이라고도 함)은 매우 유용하며, 예를 들어 요구되는 정규 분포 가정이 t-test충족되지 않고 순위에 따라 값을 변환 할 때 유용합니다. 비모수 테스트 Mann-Whitney-U-test는 더 많은 정보가 손실 될 수 있습니다. 그러나 이러한 종류의 테스트를 사용할 때 단 하나의 가정 만 …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
분포가 전력 법을 따르는 지 테스트하는 방법?
몇 명의 사용자가 몇 개의 질문을 게시하는지에 대한 데이터가 있습니다. 예를 들어 [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... 이는 2 명의 사용자가 각각 100 개의 질문을 게시하고 9 명의 사용자가 각각 10 개의 질문을 게시하는 등을 의미합니다. 그렇다면 UserCount, QuestionCount분포가 전력 법을 따르는 지 어떻게 알 …

1
로지스틱 회귀 모형 평가
나는 물류 모델을 연구하고 있으며 결과를 평가하는 데 어려움을 겪고 있습니다. 내 모델은 이항 로짓입니다. 내 설명 변수는 15 레벨의 범주 변수, 이분법 변수 및 2 개의 연속 변수입니다. 내 N은 8000보다 큽니다. 투자하려는 기업의 결정을 모형화하려고합니다. 종속 변수는 투자 (예 / 아니오)이며 15 단계 변수는 관리자가보고 한 투자에 다른 …

2
데이터 샘플이 감마 분포 제품군에 적합한 지 테스트하는 방법은 무엇입니까?
연속 랜덤 변수 X에서 생성 된 데이터 샘플이 있습니다. R을 사용하여 그린 막대 그래프에서 X의 분포가 특정 감마 분포를 따르는 것 같습니다. 그러나 나는이 감마 분포의 정확한 매개 변수를 모른다. 내 질문은 X 분포가 감마 분포 군에 속하는지 테스트하는 방법입니다. Kolmogorov-Smirnov 검정, Anderson-Darling 검정 등과 같은 적합도 검정이 있지만 이러한 …

2
로지스틱 회귀 모델 평가
이 질문은 물류 모델이 충분한 지 결정하는 방법에 대한 실제 혼란에서 비롯됩니다. 종속 변수로 형성된 후 2 년 후에 개별 프로젝트 쌍의 상태를 사용하는 모델이 있습니다. 결과는 성공적이거나 (1) 그렇지 않습니다 (0). 쌍 형성시 측정 된 독립 변수가 있습니다. 내 목표는 내가 가정 한 변수가 쌍의 성공에 영향을 미치는지 여부를 …

5
Elo 등급 또는 페이지 순위가 내 세트에 의미가 있음을 증명하는 방법은 무엇입니까?
선수 세트가 있습니다. 그들은 서로에 대해 (쌍으로) 연주합니다. 한 쌍의 플레이어가 무작위로 선택됩니다. 어떤 게임에서든 한 플레이어가 이기고 다른 플레이어가집니다. 플레이어는 서로 제한된 수의 게임을합니다 (일부 플레이어는 더 많은 게임을, 더 적은 게임을). 그래서 나는 데이터를 가지고 있습니다 (누가 누구와 몇 번이나 이겼는지). 이제는 모든 플레이어가 이길 확률을 결정하는 순위가 …

1
올가미에 대한 LARS 대 좌표 하강
L1 정규 선형 회귀 피팅에 LARS [1] 사용과 좌표 하강 사용의 장단점은 무엇입니까? 나는 주로 퍼포먼스 측면에 관심이있다 (내 문제는 N수십만에서 p20 이하인 경향이있다 ). 그러나 다른 통찰력도 인정 될 것이다. 편집 : 내가 질문을 게시 한 후 chl은 Friedman 등의 논문 [2]에 좌표 하강이 다른 방법보다 상당히 빠른 것으로 …

1
R의 NLS에 대한 적합 함을 읽는 방법은 무엇입니까?
nls ()의 출력을 해석하려고합니다. 이 게시물 을 읽었 지만 여전히 가장 적합한 방법을 이해하지 못합니다. 내 몸매에는 두 가지 출력이 있습니다. > summary(m) Formula: y ~ I(a * x^b) Parameters: Estimate Std. Error t value Pr(>|t|) a 479.92903 62.96371 7.622 0.000618 *** b 0.27553 0.04534 6.077 0.001744 ** --- Signif. …

1
귀무 가설 하에서 결정 계수
이 텍스트의 첫 페이지 하단에 아르 자형2a d j u s t e dRadjusted2R^2_\mathrm{adjusted} 조정에 관한 진술이 궁금합니다. 아르 자형2a d j u s t e d= 1 - ( 1 - R2) ( n - 1n - m - 1) .Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). 텍스트 상태는 다음과 같습니다. 조정의 논리는 다음과 …

1
R에서 회귀 스플라인이있는 로지스틱 회귀
영국의 두부 외상 데이터베이스에 대한 소급 데이터를 기반으로 로지스틱 회귀 모델을 개발하고 있습니다. 주요 결과는 30 일 사망률입니다 ( "생존"척도로 표시). 이전 연구 결과에 중대한 영향을 미친다는 증거가 발표 된 다른 조치는 다음과 같습니다. Year - Year of procedure = 1994-2013 Age - Age of patient = 16.0-101.5 ISS - …

4
매우 큰 표본 크기에 적합한 적합도
나는 매일 매우 큰 범주 형 데이터의 표본 (> 1,000,000)을 수집하고 데이터 수집에서 오류를 감지하기 위해 데이터가 날마다 "상당히"다르게 보이기를 원합니다. 나는 적합 테스트 (특히 G 테스트)를 사용하는 것이 이것에 적합하다고 생각했습니다. 예상 분포는 전날의 분포로 제공됩니다. 그러나 샘플 크기가 너무 크기 때문에 검정의 검정력이 매우 높고 많은 오 탐지가 …

3
진단 지표 ( / AUC / 정확도 / RMSE 등) 값을 기준으로 내 모델이 양호 합니까?
내 모델을 장착했으며 그것이 좋은지 이해하려고합니다. 이를 평가하기 위해 권장 측정 항목을 계산했지만 ( / AUC / 정확도 / 예측 오류 등), 해석 방법을 모릅니다. 요컨대, 메트릭을 기반으로 모델이 좋은지 어떻게 알 수 있습니까? 되어 충분한 (예를 들어) 0.6의 날 추론 또는 기본 과학 / 비즈니스 의사 결정을 그릴 진행하도록하려면?R2R2R^2R2R2R^2 …

2
Kolmogorov–Smirnov 검정 : 표본 크기가 증가함에 따라 p- 값 및 ks 검정 통계량 감소
표본 크기가 증가함에 따라 p- 값과 ks- 검정 통계가 감소하는 이유는 무엇입니까? 이 Python 코드를 예로 들어 보겠습니다. import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) 결과는 다음과 …

1
제로 팽창 된 포아송 또는 제로 팽창 된 음 이항에 대한 "이탈"측정?
D = 2 * (포화 모델의 로그 우도에서 적합 모델의 로그 우도)로 정의 된 축척 편차는 종종 GLM 모델에서 적합도의 척도로 사용됩니다. 설명 된 이탈률은 [D (null model)-D (fitted model)] / D (null model)로 정의되며 선형 회귀의 R- 제곱에 대한 GLM 아날로그로도 사용됩니다. ZIP 및 ZINB 분포가 지수 분포의 일부가 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.