«generalized-linear-model» 태그된 질문

"회귀 함수"를 통한 비선형 관계를 허용하고 반응의 분산이 예측 된 값에 의존하도록하는 선형 회귀의 일반화. (일반 선형 모델을 일반 공분산 구조 및 다변량 반응으로 확장하는 "일반 선형 모델"과 혼동하지 마십시오.)


1
전체 성공을 가진 범주 형 변수가있는 이항 glmm
이항 반응 변수와 범주 형 예측 변수로 glmm을 실행하고 있습니다. 무작위 효과는 데이터 수집에 사용 된 중첩 디자인에 의해 제공됩니다. 데이터는 다음과 같습니다. m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein m.gen1$emergence [1] 1 0 0 1 0 1 1 1 1 1 1 0 …

3
연속 데이터가 0으로 쌓인 GLM
TB, AIDS와 같은 치명적인 질병이 입원 비용에 얼마나 영향을 미치는지 추정하기 위해 모델을 실행하려고합니다. 나는 의존적 변수로 "입원 당 비용"을, 독립 변수로 다양한 개별 마커를 가지고 있으며, 거의 모두 성별, 세대주, 빈곤 상태 및 병이 있는지 여부에 대한 더미 (더하기 연령)와 같은 더미입니다. 그리고 연령 제곱)과 많은 상호 작용 용어. …

1
일반 선형 모델 (GLM)에 대해 표준 링크 함수가 항상 존재합니까?
GLM에서 스칼라 가정 및 PDF와 하부 분배 이 도시 될 수 . 링크 함수 가 다음을 만족하는 경우 여기서 는 선형 예측 변수이며 는 이것을 정식 링크 함수라고합니다. 모델.YYYθθ\thetafY(y|θ,τ)=h(y,τ)exp(θy−A(θ)d(τ))fY(y|θ,τ)=h(y,τ)exp⁡(θy−A(θ)d(τ))f_Y(y | \theta, \tau) = h(y,\tau) \exp{\left(\frac{\theta y - A(\theta)}{d(\tau)} \right)}μ=E(Y)=A′(θ)μ=E⁡(Y)=A′(θ) \mu = \operatorname{E}(Y) = A'(\theta)g(⋅)g(⋅)g(\cdot)g(μ)=θ=X′βg(μ)=θ=X′βg(\mu)=\theta = X'\beta X′βX′βX'\betag(⋅)g(⋅)g(\cdot) 내 질문은, 정규 …

4
로지스틱 회귀 및 변곡점
이진 결과와 일부 공변량을 가진 데이터가 있습니다. 로지스틱 회귀를 사용하여 데이터를 모델링했습니다. 간단한 분석만으로도 특별한 것은 없습니다. 최종 결과는 특정 공변량에 대한 확률이 어떻게 변하는 지 보여주는 선량-반응 곡선이어야합니다. 이 같은: 우리는 로지스틱 회귀 분석을 선택한 내부 검토 자 (순수 통계 학자 아님)로부터 비판을 받았습니다. 로지스틱 회귀 분석은 확률 척도에서 …

2
유전자 복제 수준에 따른 농축 분석
생물학적 배경 시간이 지남에 따라 일부 식물 종은 전체 게놈을 복제하여 각 유전자의 추가 사본을 얻는 경향이 있습니다. 이러한 구성의 불안정성으로 인해, 이들 유전자 중 다수가 결실되고 게놈이 재 배열되고 안정화되어 다시 복제 될 준비가된다. 이러한 복제 이벤트는 종 분화 및 침입 이벤트와 관련이 있으며, 이론에 따르면 복제는 식물이 새로운 …

1
이 데이터를 이항 glm에 대한 비율로 집계 할 수 있습니까?
우리는 60 명의 사람들에게 애틀랜타에 가능한 많은 식당 프랜차이즈를 나열하도록 요청했습니다. 전체 목록에는 70 개가 넘는 식당이 포함되었지만, 10 % 미만의 사람들이 언급 한 식당을 제거하여 45 명을 남겼습니다.이 45 명에 대해서는 프랜차이즈를 등록한 정보원의 비율을 계산하여 관심을 보였습니다. 이 비율을 프랜차이즈의 (로그 변환 된) 광고 예산 및 프랜차이즈가 된 …

2
GLM 출력의 분산 매개 변수
R에서 glm을 실행했으며 summary()출력 하단 근처에서 (Dispersion parameter for gaussian family taken to be 28.35031) Google에서 일부 문제를 해결했으며 분산 매개 변수가 표준 오류에 적합하다는 것을 알았습니다. 분산 매개 변수가 무엇이며 어떻게 해석 해야하는지에 대한 자세한 내용을 누군가가 제공 할 수 있기를 바랍니다.

1
R에 포아송 GLM 피팅-비율 대 개수 문제
현재 시간이 지남에 따라 일부 카운트 데이터의 GLM (및 결국 GAM)과 관련된 프로젝트를 진행하고 있습니다. 일반적으로 SAS 에서이 작업을 수행하지만 R로 이동하려고하고 ... 문제가 있습니다. 다음을 사용하여 데이터를 계산하기 위해 GLM을 적합시킬 때 : cdi_model <- glm(counts ~ exposure + covariate + month, data=test, family = poisson) 나는 얻다: Deviance …

1
이진 데이터에 대한 분산 분석을 어떻게 적용 할 수 있습니까?
n 개의 과목에 대해 이진 결과 변수 (예 : 졸업 후 고용 상태, 1 = 고용, 0 = 실업)를 예측하는 데 사용하는 4 가지 경쟁 모델이 있습니다. 모델 성능의 자연 메트릭은 적중률이며 이는 각 모델에 대한 정확한 예측의 백분율입니다. 데이터가 분산 분석의 기본 가정을 위반하므로이 설정에서 분산 분석을 사용할 수없는 …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


1
ID 링크가있는 OLS 및 Poisson GLM
내 질문은 포아송 회귀와 GLM에 대한 전반적인 이해가 부족하다는 것을 보여줍니다. 내 질문을 설명하기 위해 가짜 데이터가 있습니다. ### some fake data x=c(1:14) y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45) psuedo-R2를 리턴하는 일부 사용자 정의 함수 : ### functions of pseudo-R2 psuR2 <- …

1
드문 이벤트 로지스틱 회귀 분석에 대한 컷오프 확률을 선택하는 방법
1000 개의 양성으로 100,000 개의 관측치 (9 개의 더미 표시기 변수)가 있습니다. 이 경우에는 로지스틱 회귀가 잘 작동하지만 컷오프 확률은 당황합니다. 일반적인 문헌에서는 1과 0을 예측하기 위해 50 % 컷오프를 선택합니다. 내 모델의 최대 값이 ~ 1 %이므로이 작업을 수행 할 수 없습니다. 따라서 임계 값은 0.007 또는 그 주위에있을 …

1
우도 비 검정과 Wald 검정은 R에서 glm에 대해 다른 결론을 제공합니다.
일반화, 선형 및 혼합 모델 에서 예제를 재현하고 있습니다. 내 MWE는 다음과 같습니다. Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <- glm(formula=NoPositive/NoofPlates~log(Dilution), family=binomial("logit"), …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.