«count-data» 태그된 질문

카운트 데이터는 전체 양을 나타내는 음이 아닌 정수입니다.

4
자르지 않은 음수 이항 GEE 용 R / Stata 패키지?
이것은 나의 첫 번째 게시물입니다. 이 커뮤니티에 진심으로 감사드립니다. 0으로 잘린 종단 반응 (응답 변수 = 0이 될 확률)과 평균! = 분산을 분석하려고하므로 포아송보다 음의 이항 분포가 선택되었습니다. 내가 배제한 기능 / 명령 : 아르 자형 R의 gee () 함수는 제로 잘림이나 음의 이항 분포를 고려하지 않습니다 (MASS 패키지가로드 된 …

1
포아송 대 준-포아송 모형에서 추정 된 동일한 계수
보험 환경에서 클레임 수 데이터를 모델링 할 때 Poisson으로 시작했지만 과대 산포가 나타났습니다. Quasi-Poisson은 기본 Poisson보다 더 큰 평균-분산 관계를 더 잘 모델링했지만 계수가 Poisson과 Quasi-Poisson 모델에서 동일하다는 것을 알았습니다. 이것이 오류가 아닌 경우 왜 이런 일이 발생합니까? Poisson보다 Quasi-Poisson을 사용하면 어떤 이점이 있습니까? 참고 사항 : 근본적인 손실은 초과 …

1
ZINB 또는 다른 효과가 혼합 된 카운트 데이터에 적합한 모델을 찾는 데 어려움이 있습니까?
나는 고독한 꿀벌 풍부도에 대해 매우 작은 데이터 세트를 가지고 있는데, 분석하는데 문제가 있습니다. 그것은 계수 데이터이며, 거의 모든 계수는 다른 처리에서 대부분의 0으로 처리됩니다. 6 개의 사이트 중 2 개에 각각 하나씩 두 개의 매우 높은 값이 있으므로 카운트 분포가 매우 긴 꼬리를 갖습니다. R에서 일하고 있습니다. lme4와 glmmADMB의 …


3
과 분산 카운트 데이터에 대한 포아송 회귀에 대한 대안 선택
현재 다음 측정 값을 사용하는 일련의 행동 실험 데이터를 분석하고 있습니다. 이 실험의 참가자들은 다른 사람들이 일련의 10 개의 아나그램을 풀기 위해 사용할 수있는 실마리를 선택해야합니다. 참가자들은이 다른 사람들이 아나그램 해결 능력에 따라 돈을 벌거나 잃을 것이라고 믿게되었습니다. 단서는 그들이 얼마나 도움이되는지에 따라 다릅니다. 예를 들어, RUNNING의 아나그램 인 NUNGRIN …

2
카운트 데이터 분산의 파라 메트릭 모델링
일부 데이터를 모델링하려고하는데 어떤 유형의 모델을 사용할 수 있는지 잘 모르겠습니다. 카운트 데이터가 있고 데이터의 평균과 분산 모두에 대한 모수 추정치를 제공하는 모델을 원합니다. 즉, 다양한 예측 요소가 있으며 그룹 평균뿐만 아니라 분산에 영향을 미치는지 확인하고 싶습니다. 분산이 평균과 같기 때문에 포아송 회귀가 작동하지 않는다는 것을 알고 있습니다. 이 가정은 …


4
이 경우 포아송 회귀는 선형 회귀에 비해 어떤 이점이 있습니까?
나는 한 고등학교에서 학생들이 얻은 상 수를 포함하는 데이터 세트를 받았는데, 여기에서 획득 한 상 수의 예측 변수에는 학생이 등록한 프로그램 유형과 최종 시험 점수가 포함됩니다. 선형 회귀 모델이 왜이 경우에 적합하지 않은지, 왜 포아송 회귀를 사용하는 것이 더 좋은지 말해 줄 수 있을지 궁금합니다. 감사.

2
포아송 회귀 가정 및 R에서 검정을 테스트하는 방법
데이터에 가장 적합한 회귀 분석을 테스트하고 싶습니다. 내 종속 변수는 개수이며 많은 0이 있습니다. 그리고 사용할 모델 및 패밀리 (poisson 또는 quasipoisson 또는 0으로 부풀린 poisson 회귀)를 결정하고 가정을 테스트하는 방법을 결정하는 데 도움이 필요합니다. 포아송 회귀 : 내가 이해하는 한, 종속 변수 평균 = 분산이라는 강한 가정이 있습니다. 이것을 …

3
카운트 데이터에 대한 회귀 모델 비교
최근에 동일한 예측 변수 / 응답 데이터에 대해 4 개의 다중 회귀 모델에 적합했습니다. 포아송 회귀 분석에 적합한 두 가지 모형. model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...) model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...) 부정적인 이항 회귀 분석에 적합한 두 가지 …

2
매우 비뚤어진 카운트 데이터의 클러스터링 : 수행 할 제안 (변환 등)이 있습니까?
기본 문제 기본 문제는 다음과 같습니다. 매우 치우친 변수가 포함 된 데이터 세트를 개수로 묶으려고합니다. 변수는 많은 0을 포함하므로 클러스터링 절차에 대한 정보가 많지 않습니다. k- 평균 알고리즘 일 가능성이 큽니다. 예를 들어, 제곱근, 박스 콕스 또는 로그를 사용하여 변수를 변환하면됩니다. 그러나 내 변수는 범주 형 변수를 기반으로하기 때문에 변수를 …

3
카운트 데이터와 함께 사용하기에 가장 적합한 회귀 모델은 무엇입니까?
통계에 약간의 노력을 기울이고 있지만 뭔가 붙어 있습니다. 내 데이터는 다음과 같습니다. Year Number_of_genes 1990 1 1991 1 1993 3 1995 4 이제 데이터를 기반으로 특정 연도의 유전자 수를 예측할 수있는 회귀 모델을 만들고 싶습니다. 나는 지금까지 선형 회귀로 그것을했지만, 약간의 독서를 했으며이 종류의 데이터에 가장 적합한 선택은 아닌 것 …

2
카운트 데이터로 스케일 변수-맞습니까?
에서 본 논문 (중앙 PubMed를 통해 자유롭게 사용할 수), 저자는 0-40 득점 10 항목 심사 악기의 점수를 모델링하는 음 이항 회귀 분석을 사용합니다. 이 절차에서는 카운트 데이터를 가정하지만 여기에는 해당되지 않습니다. 이 접근법이 수용 가능한지 아닌지에 대한 당신의 의견을 부탁드립니다. 나는 때때로 내 작품에서 같은 악기 나 유사한 도구를 사용하기 …

2
하키 선수가 득점 한 총 커리어 목표를 예측할 때 포아송 회귀 분석에서 오프셋을 사용할지 여부
오프셋을 사용할지 여부에 대한 질문이 있습니다. 하키에서 (전체) 수의 목표를 설명하려는 매우 쉬운 모델을 가정하십시오. 따라서 플레이어는 스트라이커 인 경우 골, 목표로하는 게임 수 및 더미 변수 "스트라이커"가 1이고 그렇지 않으면 0입니다. 다음 중 어떤 모델이 올바르게 지정 되었습니까? goals = games + striker 또는 목표 = 오프셋 (게임) + …

3
일부 관측치에 대해 오프셋 변수가 0 인 모델링 카운트 데이터
동료의 학생을 돕기 위해 노력하고 있습니다. 학생은 실험 설정에서 조류 행동 (전화 수)을 관찰하고 계산했습니다. 각각의 실험 동안 특정 관찰 된 조류에 기인 한 호출 수는 결정될 수 없었지만, 기록 된 호출 수에 기여한 조류 수를 세는 것이 가능했다. 따라서 초기 제안은 Poisson GLM 모델에서 새 수를 오프셋 용어로 포함하는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.