모델
하자 한 "B"카테고리를 가지며, 경우 그렇지. , 및 정의하십시오 . 만약 , 그때 우리는 카테고리 "A"가 (즉, "A"입니다 기준 레벨). 그런 다음 모델을 다음과 같이 쓸 수 있습니다.xB=1xB=0xCxDxExB=xC=xD=xE=0
logit(π)=β0+βBxB+βCxC+βDxD+βExE
및 차단
β0
R의 데이터 생성
(ㅏ)
x <- sample(x=c("A","B", "C", "D", "E"),
size=n, replace=TRUE, prob=rep(1/5, 5))
x
벡터를 갖는 n
구성 요소 (각 하나). 각 구성 요소는 "A", "B", "C", "D"또는 "E"입니다. "A", "B", "C", "D"및 "E"는 각각 동일 할 가능성이 있습니다.
(비)
library(dummies)
dummy(x)
dummy(x)
, , , 및n
해당하는 행 (각 개인에 대해 하나씩)과 5 개의 열 이있는 행렬입니다 . 그런 다음 선형 예측 변수 (각 개인마다 하나씩)를 다음과 같이 쓸 수 있습니다.xAxBxCxDxE
linpred <- cbind(1, dummy(x)[, -1]) %*% c(beta0, betaB, betaC, betaD, betaE)
(씨)
성공 확률은 로지스틱 모델에서 따릅니다.
pi <- exp(linpred) / (1 + exp(linpred))
(디)
이제 이진 반응 변수를 생성 할 수 있습니다. 번째 응답은 이항 확률 변수에서 유래 와 및 :iBin(n,p)n=1p= pi[i]
y <- rbinom(n=n, size=1, prob=pi)
이것을 확인하는 몇 가지 빠른 시뮬레이션은 괜찮습니다.
> #------ parameters ------
> n <- 1000
> beta0 <- 0.07
> betaB <- 0.1
> betaC <- -0.15
> betaD <- -0.03
> betaE <- 0.9
> #------------------------
>
> #------ initialisation ------
> beta0Hat <- rep(NA, 1000)
> betaBHat <- rep(NA, 1000)
> betaCHat <- rep(NA, 1000)
> betaDHat <- rep(NA, 1000)
> betaEHat <- rep(NA, 1000)
> #----------------------------
>
> #------ simulations ------
> for(i in 1:1000)
+ {
+ #data generation
+ x <- sample(x=c("A","B", "C", "D", "E"),
+ size=n, replace=TRUE, prob=rep(1/5, 5)) #(a)
+ linpred <- cbind(1, dummy(x)[, -1]) %*% c(beta0, betaB, betaC, betaD, betaE) #(b)
+ pi <- exp(linpred) / (1 + exp(linpred)) #(c)
+ y <- rbinom(n=n, size=1, prob=pi) #(d)
+ data <- data.frame(x=x, y=y)
+
+ #fit the logistic model
+ mod <- glm(y ~ x, family="binomial", data=data)
+
+ #save the estimates
+ beta0Hat[i] <- mod$coef[1]
+ betaBHat[i] <- mod$coef[2]
+ betaCHat[i] <- mod$coef[3]
+ betaDHat[i] <- mod$coef[4]
+ betaEHat[i] <- mod$coef[5]
+ }
> #-------------------------
>
> #------ results ------
> round(c(beta0=mean(beta0Hat),
+ betaB=mean(betaBHat),
+ betaC=mean(betaCHat),
+ betaD=mean(betaDHat),
+ betaE=mean(betaEHat)), 3)
beta0 betaB betaC betaD betaE
0.066 0.100 -0.152 -0.026 0.908
> #---------------------