올바른 교차 검증 및 모델 선택 절차를 따를 때에도 모델 복잡성, 기간에 제한을 두지 않는 한 모델을 충분히 검색 하지 않으면 과적 합 이 발생 한다는 것을 이해 합니다. 더욱이 사람들은 종종 그들이 제공 할 수있는 보호를 약화시키는 데이터로부터 모델 복잡성에 대한 처벌을 배우려고 시도합니다. 내 질문은 : 위의 진술에 …
에서 통계 모델링 : 두 문화 레오 브레이 만 쓴다 현재 적용되는 관행은 적합도 검정 및 잔차 분석을 사용하여 데이터 모델 적합을 확인하는 것입니다. 몇 년 전 한 시점에서 제어 된 양의 비선형 성으로 7 차원으로 시뮬레이션 된 회귀 문제를 설정했습니다. 적합도에 대한 표준 테스트는 비선형 성이 극단적 일 때까지 …
추세선에 맞추려는 데이터가 있습니다. 나는 데이터가 전력 법칙을 따를 것이라고 생각하므로 직선을 찾기 위해 로그 로그 축에 데이터를 플로팅했습니다. 이로 인해 (거의) 직선이 생겨서 Excel에서 전력 법칙에 대한 추세선을 추가했습니다. 통계가 newb이기 때문에, 내 질문은, "선 이 잘 맞는 것처럼 보입니다 "에서 "숫자 속성 는 이 그래프가 전력 법에 의해 …
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
MASS 패키지를 R사용하여 MM 가중치 로 강력한 선형 모델을 추정했습니다 rlm(). `R``은 모델에 값을 제공하지 않지만 의미있는 수량이라면 값을 원합니다. 또한 관측치가 강력한 회귀 분석에서 가중치를 적용한 것과 같은 방식으로 총 및 잔류 분산을 측정 하는 R 2 값을 갖는 데 어떤 의미가 있는지 알고 싶습니다 . 나의 일반적인 생각은, …
제 연구에서 두 가지 주요 딜레마에 관한 조언이 필요합니다. 이는 3 가지 큰 제약과 혁신에 대한 사례 연구입니다. 연간 특허 수는 종속 변수입니다. 내 질문은 좋은 모델을위한 가장 중요한 기준은 무엇입니까? 더 중요한 것은 무엇입니까? 대부분 또는 모든 변수가 중요합니까? "F STATISTIC"의 조사입니까? "Adjusted R squared"의 값입니까? 둘째, 연구에 가장 …
별 매개 변수를 나타내는 두 가지 데이터 세트가 있습니다 : 관찰 된 것과 모델링 된 것. 이 세트를 사용하여 2 색 다이어그램 (TCD)을 만듭니다. 샘플은 여기에서 볼 수 있습니다. A 는 관찰 된 데이터이고 B 는 모델에서 추출 된 데이터입니다 (검은 선을 염두에 두지 말고 점은 데이터를 나타냅니다) 나는 하나의 …
이런 종류의 환경에서 카이 제곱의 저전력의 명백한 문제를 제쳐두고 데이터를 비닝하여 지정되지 않은 매개 변수로 일부 밀도에 대해 카이 제곱 우수성 테스트를 수행한다고 상상해보십시오. 구체적으로 알 수없는 평균과 표본 크기가 100 인 지수 분포를 가정 해 봅시다. 구간당 합당한 수의 관측 값을 얻으려면 데이터를 고려해야합니다 (예 : 평균값 아래에 6 …
R 2 사이에 관계가 있는지 궁금합니다R2R2R^2 와 F-Test . 일반적으로 R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} 이며 회귀에서 선형 관계의 강도를 측정합니다. F- 검정은 단지 가설을 입증합니다. R2R2R^2 와 F- 검정 사이에는 관계가 있습니까?
데이터가 있다고 가정하고 데이터를 비선형 회귀 모델에 맞 춥니 다. 그런 다음 R 제곱 ( )을 계산합니다 .R2아르 자형2R^2 R- 제곱이 음수이면 그 의미는 무엇입니까? 그것은 내 모델이 나쁘다는 것을 의미합니까? 의 범위는 [-1,1] 일 수 있다는 것을 알고 있습니다. R 2 가 0 일 때 그 의미는 무엇입니까?R2아르 자형2R^2R2아르 …
적합도에 대한 카이-제곱 검정의 맥락에서 피어슨 잔차에 대한 초보자의 질문 : 검정 통계량뿐만 아니라 R의 chisq.test함수는 Pearson의 잔차를보고합니다. (obs - exp) / sqrt(exp) 표본이 작을수록 차이가 작기 때문에 관측 값과 기대 값의 원시 차이를 보는 것이 그다지 유익하지 않은 이유를 이해합니다. 그러나 분모의 효과에 대해 더 알고 싶습니다. 왜 예상 …
몇 달 전에 나는 R on SO의 homoscedasticity 테스트에 관한 질문을 게시했으며 Ian Fellows는 다음과 같이 대답했습니다. Homocedasticity 테스트는 모델의 적합도를 테스트 할 때 좋은 도구가 아닙니다. 작은 표본의 경우 동종이 변성에서 이탈을 감지하기에 충분한 검정력이없고 큰 표본의 경우 "충분한 검정력"이 있으므로 평등에서 사소한 이탈까지도 선별 할 가능성이 높습니다. 그의 …
세 가지 범주로 카이-제곱 적합도 (GOF) 테스트를 수행하고 있으며 특히 각 범주의 모집단 비율이 같은지 (예 : 비율이 각 그룹의 1/3 임) null을 테스트하려고합니다. 관찰 된 데이터 그룹 1 그룹 2 그룹 3 총계 686928 1012 2626 따라서이 GOF 테스트의 경우 예상 카운트는 2626 (1/3) = 875.333이며 테스트 는 <0.0001 …