다음은 작은 예입니다.
MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3))
이제 base::lm
:
> lm(y~x, data=MyDf) %>% summary
Call:
lm(formula = y ~ x, data = MyDf)
Residuals:
1 2 3 4
-0.47 0.41 0.59 -0.53
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.0500 0.8738 3.491 0.0732 .
x -1.3800 0.3191 -4.325 0.0495 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7134 on 2 degrees of freedom
Multiple R-squared: 0.9034, Adjusted R-squared: 0.8551
F-statistic: 18.71 on 1 and 2 DF, p-value: 0.04952
이제 패키지 biglm
에서 같은 것을 시도하십시오 biglm
.
XX<-biglm(y~x, data=MyDf)
print(summary(XX), digits=5)
Large data regression model: biglm(y ~ x, data = MyDf)
Sample size = 4
Coef (95% CI) SE p
(Intercept) 3.05 1.30243 4.79757 0.87378 0.00048
x -1.38 -2.01812 -0.74188 0.31906 0.00002
우리가 필요하다는 주 print
와 digits
P 값을 볼 수 있습니다. 계수와 표준 오차는 동일하지만 p- 값은 매우 다릅니다. 왜 그렇습니까?
pt(-3.491, 2)*2
에pnorm(-3.491)*2
예를 들어,.