«generalized-linear-model» 태그된 질문

"회귀 함수"를 통한 비선형 관계를 허용하고 반응의 분산이 예측 된 값에 의존하도록하는 선형 회귀의 일반화. (일반 선형 모델을 일반 공분산 구조 및 다변량 반응으로 확장하는 "일반 선형 모델"과 혼동하지 마십시오.)

1
카운트 데이터에 포아송 대 기하 대 음 이항 GLM을 언제 사용해야합니까?
GLM 프레임 워크 내에서 카운트 데이터와 함께 어떤 회귀 유형 (형상, 포아송, 음 이항)을 사용하는 것이 적절할 때 나 자신을 위해 레이아웃하려고합니다 (8 개의 GLM 분포 중 3 개만 카운트 데이터에 사용됩니다. 음의 이항 분포와 포아송 분포 중심을 읽었습니다). 카운트 데이터에 포아송 대 기하 대 음 이항 GLM을 언제 사용해야합니까? …

2
family = Gamma를 사용하여 GLM에서 매개 변수를 해석하는 방법
이 질문은 교차 검증에서 답변 될 수 있기 때문에 스택 오버플 로 에서 마이그레이션 되었습니다. 5 년 전에 마이그레이션 되었습니다 . 감마 분포 종속 변수가있는 GLM의 매개 변수 해석에 관한 질문이 있습니다. 이것이 로그 링크와 함께 R이 내 GLM에 대해 반환하는 것입니다. Call: glm(formula = income ~ height + age …

3
포아송 회귀 vs 로그 수 최소 제곱 회귀?
포아송 회귀는 로그 링크 기능 이있는 GLM 입니다. 비정규 분산 카운트 데이터를 모델링하는 다른 방법은 로그 (또는 log (1 + count)를 0으로 처리)를 사용하여 사전 처리하는 것입니다. 로그 카운트 반응에 대해 최소 제곱 회귀 분석을 수행하면 포아송 회귀 분석과 관련이 있습니까? 비슷한 현상을 처리 할 수 ​​있습니까?

1
GLM의 유사-포아송이 왜 음이 항의 특수한 경우로 취급되지 않습니까?
과도하게 분산되거나 분산되지 않은 카운트 데이터 세트에 일반 선형 모델을 맞추려고합니다. 여기에 적용되는 두 가지 정규 분포는 Poisson과 Negative Binomial (Negbin)이며 EV 와 분산입니다.μμ\mu VR피= μVarP=μVar_P = \mu VR엔비= μ + μ2θVarNB=μ+μ2θVar_{NB} = \mu + \frac{\mu^2}{\theta} 이는 사용 R에 장착 가능 glm(..,family=poisson)하고 glm.nb(...), 각각. quasipoisson내 이해에는 동일한 EV와 분산으로 조정 …

3
glm (R)에서 적합도를 계산하는 방법
이 질문은 교차 검증에서 답변 될 수 있기 때문에 스택 오버플 로 에서 마이그레이션 되었습니다. 6 년 전에 이주했습니다 . glm 기능을 실행하면 다음과 같은 결과가 나타납니다. 다음 값을 어떻게 해석 할 수 있습니까? 널 이탈 잔여 이탈 AIC 그들은 적합 함과 관련이 있습니까? 이 결과에서 R-square 또는 다른 측정 …

1
베이지안 네트워크에서 신경 네트워크로 : 다변량 회귀를 다중 출력 네트워크로 전치하는 방법
나는 베이지안 계층 선형 모델 (여기서 그것을 설명하는 네트워크)을 다루고 있습니다. 는 슈퍼마켓에서 관찰 된 제품의 일일 판매량을 나타냅니다.YYY 는 가격, 프로모션, 요일, 날씨, 휴일을 포함하여 알려진 회귀 행렬입니다.XXX 는 각 제품의 알려지지 않은 잠재 재고 수준으로, 가장 많은 문제를 유발하고, 이진 변수로 구성된 벡터를 고려합니다. 각 제품마다 1 개가품절됨을 …

1
왜 로지스틱 회귀가 완벽한 분리 사례에서 작동하지 않는지에 대한 직관적 인 설명이 있습니까? 왜 정규화를 추가하면 문제가 해결됩니까?
로지스틱 회귀 분석에서 완벽한 분리에 대한 많은 토론이 있습니다. 예를 들어 R의 로지스틱 회귀는 완벽한 분리 (Hauck-Donner 현상)를 초래했습니다. 이제 뭐? 및 로지스틱 회귀 모델은 수렴하지 않습니다 . 개인적으로 여전히 문제가되는 이유와 정규화를 추가하면 문제가 해결되는 것은 직관적이지 않다고 생각합니다. 애니메이션을 만들어서 도움이 될 것이라고 생각합니다. 따라서 자신의 질문을 게시하고 …

4
베타 회귀에서 0.1 값 다루기
[0,1]에 베타 회귀 분석으로 분석하려는 데이터가 있습니다. 물론 0,1 값을 수용하려면 무언가를 수행해야합니다. 모델에 맞게 데이터 수정을 싫어합니다. 또한 나는 0과 1 인플레이션이 좋은 생각이라고 생각하지 않습니다.이 경우 0은 매우 작은 양수 값으로 간주해야한다고 생각하기 때문에 (그러나 나는 어떤 값이 적절한 지 정확하게 말하고 싶지 않습니다. .001 및 .999와 같은 …

2
비율 데이터 변환 : arcsin square root가 충분하지 않은 경우
백분율 / 비율 데이터에 대한 아크 신 제곱근 변환에 대한 (강한?) 대안이 있습니까? 현재 작업중 인 데이터 세트 에서이 변환을 적용한 후에도 현저한 이분산성이 남아 있습니다. 즉 잔차 대 적합치의 플롯은 여전히 ​​마름모꼴입니다. 의견에 응답하기 위해 편집 : 데이터는 10 %의 배수로 엔 다우먼트의 0-100 %를 투자 할 수있는 실험 …

3
GLM에서 절편 용어를 해석하는 방법은 무엇입니까?
R을 사용하고 있으며 Binomial 링크가있는 GLM으로 데이터를 분석하고 있습니다. 출력 테이블에서 인터셉트의 의미가 무엇인지 알고 싶습니다. 내 모델 중 하나에 대한 절편은 크게 다르지만 변수는 다릅니다. 이것은 무엇을 의미 하는가? 요격이란 무엇입니까? 나는 단지 자신을 혼란스럽게하지만 인터넷을 검색했는지 모르겠습니다. 단지 말하는 것이 없습니다. 매우 좌절 한 학생을 도와주세요 glm(formula = …

1
R에서 'NA'값이 glm에서 처리되는 방식
거의 천 개의 변수 (V1)와 약 2 억 개의 데이터 포인트가 포함 된 데이터 테이블 T1이 있습니다. 데이터가 드물고 대부분의 항목이 NA입니다. 각 데이터 포인트에는 다른 ID와 구별하기 위해 고유 한 ID 및 날짜 쌍이 있습니다. 별도의 변수 세트 (V2)를 포함하는 다른 테이블 T2가 있습니다. 이 테이블에는 T2의 항목을 고유하게 …

2
어떤 GLM 제품군의 사용을 검증 할 수있는 진단은 무엇입니까?
이것은 매우 기초적인 것처럼 보이지만 항상이 시점에서 멈춰 있습니다. 내가 다루는 대부분의 데이터는 비정규 적이며 대부분의 분석은 GLM 구조를 기반으로합니다. 현재 분석을 위해 "보행 속도"(미터 / 분) 인 응답 변수가 있습니다. OLS를 사용할 수 없다는 것을 쉽게 알 수 있지만 어떤 가족 (감마, Weibull 등)이 적합한 지 결정하는 데 큰 …

1
적합도 및 선형 회귀 또는 포아송을 선택할 모델
제 연구에서 두 가지 주요 딜레마에 관한 조언이 필요합니다. 이는 3 가지 큰 제약과 혁신에 대한 사례 연구입니다. 연간 특허 수는 종속 변수입니다. 내 질문은 좋은 모델을위한 가장 중요한 기준은 무엇입니까? 더 중요한 것은 무엇입니까? 대부분 또는 모든 변수가 중요합니까? "F STATISTIC"의 조사입니까? "Adjusted R squared"의 값입니까? 둘째, 연구에 가장 …

4
이분산성을 다루는 가장 좋은 방법은?
이분산성이 매우 명확한 적합 값의 함수로 선형 모델의 잔차 값을 플롯했습니다. 그러나이 이분산성이 내 선형 모델을 무효화한다는 것을 이해하기 때문에 지금 어떻게 진행 해야할지 잘 모르겠습니다. (맞습니까?) 이분산성에 강하기 때문에 패키지 의 rlm()기능을 사용하여 강력한 선형 피팅을 사용하십시오 MASS. 이분산성으로 인해 계수의 표준 오차가 잘못되었으므로 이분산성에 견고하도록 표준 오차를 조정할 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.