«generalized-linear-model» 태그된 질문

"회귀 함수"를 통한 비선형 관계를 허용하고 반응의 분산이 예측 된 값에 의존하도록하는 선형 회귀의 일반화. (일반 선형 모델을 일반 공분산 구조 및 다변량 반응으로 확장하는 "일반 선형 모델"과 혼동하지 마십시오.)


4
카운트 회귀에 대한 진단 플롯
결과가 카운트 변수 인 회귀에 대한 가장 유용한 정보는 무엇입니까? 특히 포아송 및 음 이항 모델뿐만 아니라 제로 팽창 및 허들 대응에 관심이 있습니다. 내가 찾은 대부분의 소스는 단순히 이러한 플롯이 어떻게 보이는지에 대한 설명없이 잔차 대 적합치 값을 플로팅합니다. 지혜와 참고 문헌은 크게 감사합니다. 관련이 있는지 묻는 이유에 대한 …

4
감마 GLM 사용시기
감마 분포는 상당히 넓은 범위의 모양을 취할 수 있으며 두 매개 변수를 통한 평균과 분산 사이의 링크를 고려하면 음이 아닌 데이터의 이분산성을 로그 변환 된 OLS가 처리 할 수있는 방식으로 처리하는 데 적합합니다 WLS 또는 이종 불균형 일관성 VCV 추정기 없이는 할 수 없습니다. 나는 음이 아닌 일상적인 데이터 모델링에 …

3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

5
단계별 회귀에 대한 현대적이고 쉽게 사용되는 대안은 무엇입니까?
약 30 개의 독립 변수가있는 데이터 세트가 있으며 GLM (Generalized Linear Model)을 구성하여 변수와 종속 변수 간의 관계를 탐색하려고합니다. 나는이 상황에 대해 배운 방법, 단계적 회귀가 이제 통계적 죄로 간주된다는 것을 알고 있습니다. 이 상황에서 어떤 현대적인 모델 선택 방법을 사용해야합니까?

4
GLM의 "링크 기능"과 "정식 링크 기능"의 차이점은 무엇입니까?
'링크 기능'과 '정식 링크 기능'이라는 용어의 차이점은 무엇입니까? 또한, 하나를 다른 것보다 사용하는 (이론적) 장점이 있습니까? 예를 들어, 이진 응답 변수는 logit , probit 등과 같은 많은 링크 함수를 사용하여 모델링 할 수 있습니다 . 그러나 여기서 logit 은 "정식"링크 함수로 간주됩니다.

1
푸 아송 회귀 분석에서 계수를 해석하는 방법은 무엇입니까?
푸 아송 회귀 분석에서 주 효과 (더미 코딩 된 요인의 계수)를 해석하려면 어떻게해야합니까? 다음 예제를 가정하십시오. treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, 2, 3), labels …

3
로지스틱 회귀 분석에서 잔차는 무엇을 의미합니까?
이 질문에 답하면서 John Christie는 로지스틱 회귀 모형의 적합도를 잔차를 평가하여 평가해야한다고 제안했습니다. OLS의 잔차를 해석하는 방법에 익숙합니다. DV와 같은 척도에 있으며 모형에서 예측 한 y와 y의 차이가 매우 명확합니다. 그러나 로지스틱 회귀 분석의 경우 과거에는 로지스틱 회귀 분석에서 잔차가 무엇을 의미하는지 알지 못했기 때문에 일반적으로 AIC와 같은 모형 적합도 …

1
카운트 데이터에 왜 제곱근 변환이 권장됩니까?
카운트 데이터가있을 때 제곱근을 취하는 것이 종종 권장됩니다. (CV에 대한 몇 가지 예는 @HarveyMotulsky의 대답은 여기 또는 @whuber의 대답은 여기를 참조하십시오 .) 반면 포아송으로 분포 된 반응 변수가있는 일반화 된 선형 모형을 피팅 할 때 로그는 정식 링크 입니다. 이것은 응답 데이터의 로그 변환을 수행하는 것과 비슷합니다 (더 정확하게 는 …

4
로그 변환 된 응답 변수에 대해 LM과 GLM 중에서 선택
GLM (Generalized Linear Model)과 LM (Linear Model)을 사용하는 철학을 이해하려고합니다. 아래에 예제 데이터 세트를 만들었습니다. log(y)=x+εlog⁡(y)=x+ε\log(y) = x + \varepsilon 이 예제에는 크기의 함수로 오류가 없으므로 로그 변환 된 y의 선형 모델이 가장 좋다고 가정합니다. 아래 예제에서는 로그 변환 된 데이터에 대한 LM의 AIC가 가장 낮기 때문에 실제로 그런 경우입니다. …

9
고급 통계 책 추천
이 사이트에는 입문 통계 및 기계 학습 에 대한 책 권장 사항에 대한 몇 가지 스레드가 있지만 최대 가능성, 일반 선형 모델, 주요 구성 요소 분석, 비선형 모델을 포함하여 고급 통계에 대한 텍스트를 찾고 있습니다. 나는 AC Davison의 통계 모델 을 시도 했지만 솔직히 2 장 후에 내려 놓아야했습니다. 이 …

1
로지스틱 회귀 모형 적합에서 예측 값 (Y = 1 또는 0) 얻기
내가 glm로지스틱 회귀 모델에 해당하는 클래스의 객체를 가지고 있고 predict.glm인수 type="response"를 사용하여 주어진 예측 확률을 또는 으로 바꾸고 싶다고 가정 해 봅시다 . R에서 가장 빠르고 가장 정식적인 방법은 무엇입니까?Y=1Y=1Y=1Y=0Y=0Y=0 다시, 나는 알고 있지만, predict.glm컷오프 값 P (Y_i = 1 | \ hat X_ {i}) 가 정확히 어디에 있는지는 알지 …


2
GLM R의 잔차 및 널 편차 해석
R에서 GLM의 Null 및 Residual Deviance를 해석하는 방법은 무엇입니까? 마찬가지로 AIC가 작을수록 좋습니다. 이탈에 대한 유사하고 빠른 해석이 있습니까? Null 이탈 : 1077 자유도에서 1146.1 잔류 이탈 : 1099 자유도에서 4589.4 AIC : 11089

3
로그 변환 응답이있는 선형 모델과 로그 링크가있는 일반화 된 선형 모델
에서 본 논문 제목 "일반화 선형 모델 APPLIED TO 의료 데이터 중 선택"저자는 쓰기 : 일반화 된 선형 모형에서 평균은 반응 자체를 변환하는 대신 링크 함수에 의해 변환됩니다. 두 가지 변환 방법은 결과가 매우 다를 수 있습니다. 예를 들어, 로그 변환 된 반응의 평균은 평균 반응의 로그와 같지 않습니다 . …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.