통계 및 빅 데이터 goodness-of-fit

3

데이터가 지수 분포에 맞는지 어떻게 확인합니까?

급여와 같은 내 데이터가 R의 지속적인 지수 분포에서 나온 것인지 어떻게 확인할 수 있습니까? 내 샘플의 히스토그램은 다음과 같습니다. . 어떤 도움이라도 대단히 감사하겠습니다!

22 r distributions goodness-of-fit exponential

6

작은 샘플에 대한 적절한 정규성 테스트

지금까지 작은 표본의 정규성 가정을 테스트하기 위해 Shapiro-Wilk 통계를 사용했습니다. 다른 기술을 추천 해 주시겠습니까?

22 hypothesis-testing goodness-of-fit normality-assumption small-sample

5

과적 합 :은 총알이 없습니까?

올바른 교차 검증 및 모델 선택 절차를 따를 때에도 모델 복잡성, 기간에 제한을 두지 않는 한 모델을 충분히 검색 하지 않으면 과적 합 이 발생 한다는 것을 이해 합니다. 더욱이 사람들은 종종 그들이 제공 할 수있는 보호를 약화시키는 데이터로부터 모델 복잡성에 대한 처벌을 배우려고 시도합니다. 내 질문은 : 위의 진술에 …

21 machine-learning cross-validation goodness-of-fit scikit-learn caret

2

회귀에서 선형성을 테스트하기 어려움

에서 통계 모델링 : 두 문화 레오 브레이 만 쓴다 현재 적용되는 관행은 적합도 검정 및 잔차 분석을 사용하여 데이터 모델 적합을 확인하는 것입니다. 몇 년 전 한 시점에서 제어 된 양의 비선형 성으로 7 차원으로 시뮬레이션 된 회귀 문제를 설정했습니다. 적합도에 대한 표준 테스트는 비선형 성이 극단적 일 때까지 …

21 regression goodness-of-fit

2

전력 법칙에 대한 추세선의 적합도를 측정 / 논쟁하는 방법은 무엇입니까?

추세선에 맞추려는 데이터가 있습니다. 나는 데이터가 전력 법칙을 따를 것이라고 생각하므로 직선을 찾기 위해 로그 로그 축에 데이터를 플로팅했습니다. 이로 인해 (거의) 직선이 생겨서 Excel에서 전력 법칙에 대한 추세선을 추가했습니다. 통계가 newb이기 때문에, 내 질문은, "선 이 잘 맞는 것처럼 보입니다 "에서 "숫자 속성 는 이 그래프가 전력 법에 의해 …

21 goodness-of-fit power-law

4

엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?

정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

2

견고한 선형 모형 의 가중

MASS 패키지를 R사용하여 MM 가중치 로 강력한 선형 모델을 추정했습니다 rlm(). `R``은 모델에 값을 제공하지 않지만 의미있는 수량이라면 값을 원합니다. 또한 관측치가 강력한 회귀 분석에서 가중치를 적용한 것과 같은 방식으로 총 및 잔류 분산을 측정 하는 R 2 값을 갖는 데 어떤 의미가 있는지 알고 싶습니다 . 나의 일반적인 생각은, …

19 r goodness-of-fit r-squared robust rlm

1

적합도 및 선형 회귀 또는 포아송을 선택할 모델

제 연구에서 두 가지 주요 딜레마에 관한 조언이 필요합니다. 이는 3 가지 큰 제약과 혁신에 대한 사례 연구입니다. 연간 특허 수는 종속 변수입니다. 내 질문은 좋은 모델을위한 가장 중요한 기준은 무엇입니까? 더 중요한 것은 무엇입니까? 대부분 또는 모든 변수가 중요합니까? "F STATISTIC"의 조사입니까? "Adjusted R squared"의 값입니까? 둘째, 연구에 가장 …

19 regression generalized-linear-model linear-model goodness-of-fit poisson-regression

1

2D 히스토그램에 대한 적합도

별 매개 변수를 나타내는 두 가지 데이터 세트가 있습니다 : 관찰 된 것과 모델링 된 것. 이 세트를 사용하여 2 색 다이어그램 (TCD)을 만듭니다. 샘플은 여기에서 볼 수 있습니다. A 는 관찰 된 데이터이고 B 는 모델에서 추출 된 데이터입니다 (검은 선을 염두에 두지 말고 점은 데이터를 나타냅니다) 나는 하나의 …

19 goodness-of-fit histogram

2

카이 제곱 적합도 검정에 대한 데이터 기반 구간 경계의 영향?

이런 종류의 환경에서 카이 제곱의 저전력의 명백한 문제를 제쳐두고 데이터를 비닝하여 지정되지 않은 매개 변수로 일부 밀도에 대해 카이 제곱 우수성 테스트를 수행한다고 상상해보십시오. 구체적으로 알 수없는 평균과 표본 크기가 100 인 지수 분포를 가정 해 봅시다. 구간당 합당한 수의 관측 값을 얻으려면 데이터를 고려해야합니다 (예 : 평균값 아래에 6 …

18 chi-squared goodness-of-fit binning

4

사이의 관계

R 2 사이에 관계가 있는지 궁금합니다R2R2R^2 와 F-Test . 일반적으로 R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} 이며 회귀에서 선형 관계의 강도를 측정합니다. F- 검정은 단지 가설을 입증합니다. R2R2R^2 와 F- 검정 사이에는 관계가 있습니까?

17 regression hypothesis-testing least-squares goodness-of-fit

3

음의 R- 제곱은 무엇을 의미합니까?

데이터가 있다고 가정하고 데이터를 비선형 회귀 모델에 맞 춥니 다. 그런 다음 R 제곱 ( )을 계산합니다 .R2아르 자형2R^2 R- 제곱이 음수이면 그 의미는 무엇입니까? 그것은 내 모델이 나쁘다는 것을 의미합니까? 의 범위는 [-1,1] 일 수 있다는 것을 알고 있습니다. R 2 가 0 일 때 그 의미는 무엇입니까?R2아르 자형2R^2R2아르 …

17 regression goodness-of-fit r-squared curve-fitting

2

피어슨의 잔차

적합도에 대한 카이-제곱 검정의 맥락에서 피어슨 잔차에 대한 초보자의 질문 : 검정 통계량뿐만 아니라 R의 chisq.test함수는 Pearson의 잔차를보고합니다. (obs - exp) / sqrt(exp) 표본이 작을수록 차이가 작기 때문에 관측 값과 기대 값의 원시 차이를 보는 것이 그다지 유익하지 않은 이유를 이해합니다. 그러나 분모의 효과에 대해 더 알고 싶습니다. 왜 예상 …

16 chi-squared goodness-of-fit residuals

5

분산 분석 가정 확인

몇 달 전에 나는 R on SO의 homoscedasticity 테스트에 관한 질문을 게시했으며 Ian Fellows는 다음과 같이 대답했습니다. Homocedasticity 테스트는 모델의 적합도를 테스트 할 때 좋은 도구가 아닙니다. 작은 표본의 경우 동종이 변성에서 이탈을 감지하기에 충분한 검정력이없고 큰 표본의 경우 "충분한 검정력"이 있으므로 평등에서 사소한 이탈까지도 선별 할 가능성이 높습니다. 그의 …

16 hypothesis-testing anova nonparametric goodness-of-fit heteroscedasticity

2

카이-제곱 적합도 테스트를위한 사후 테스트

세 가지 범주로 카이-제곱 적합도 (GOF) 테스트를 수행하고 있으며 특히 각 범주의 모집단 비율이 같은지 (예 : 비율이 각 그룹의 1/3 임) null을 테스트하려고합니다. 관찰 된 데이터 그룹 1 그룹 2 그룹 3 총계 686928 1012 2626 따라서이 GOF 테스트의 경우 예상 카운트는 2626 (1/3) = 875.333이며 테스트 는 <0.0001 …

16 hypothesis-testing chi-squared goodness-of-fit post-hoc

«goodness-of-fit» 태그된 질문