무 팽창 감마 모델의 올바른 사용 및 해석


11

배경 : 저는 현재 세포 발현률의 데이터 세트로 씨름하고있는 생물 통계 학자입니다. 이 연구 는 다양한 공여자로부터 그룹 으로 수집 된 다수의 세포 를 특정 펩티드에 노출시켰다 . 세포는 반응에 따라 특정 바이오 마커를 발현하거나 그렇지 않다. 그런 다음 각 공여자 그룹에 대한 응답 속도가 기록됩니다. 반응 속도 (백분율로 표시)는 관심있는 결과이며 펩타이드 노출은 예측 변수입니다.

관찰은 공여자 내에 모여 있다는 점에 유의하십시오.

요약 데이터 만 있으므로 기증자 응답 속도를 연속 데이터 (최소한 현재)로 취급합니다.

합병증은 데이터에 많은 영점이 있다는 사실에서 발생합니다. 무시하기에는 너무 많습니다. 나는 0의 과잉과 함께 연속적인 데이터를 기울 였다는 사실을 다루기 위해 제로 팽창 된 감마 모델을 고려하고 있습니다. 나는 또한 Tobit 모델을 고려했지만, 진정한 제로와는 대조적으로, 하한에서 검열을 가정하기 때문에 열등한 것으로 보입니다 (경제학자들은 구별이 무의미하다고 말할 수 있습니다).

질문 : 일반적으로 무 팽창 감마 모델을 사용하는 것이 적절한시기는 언제입니까? 즉, 가정은 무엇입니까? 그리고 그 추론을 어떻게 해석합니까? 이에 대해 논의하는 논문에 대한 링크가 있으면 감사하겠습니다.

SAS-L 에서 Dale McLerran이 0으로 팽창 된 감마 모델에 NLMIXED 코드를 제공 하는 링크를 찾았 으므로 가능해 보입니다. 그럼에도 불구하고, 나는 맹목적으로 청구하는 것을 싫어합니다.

답변:


5

먼저, 식 데이터에 0이 표시되지 않습니다. 귀하의 생물학자는 모든 생물 학자들과 마찬가지로 생물학자가 "제로"라고 말할 때 실제로 "감지 임계 값 이하이므로 존재하지 않습니다"를 의미합니다. 현장에서 수학적 정교함이 없기 때문에 언어 문제입니다. 나는 여기에서 개인적인 경험에서 말합니다.

제공하는 링크에서 0으로 팽창 된 감마에 대한 설명은 훌륭합니다. 귀하의 데이터로 이어지는 물리적 과정은 내가 이해하면 기증자를 선택하고 특정 펩티드로 치료 한 후 그 기증자의 세포에서 반응을 측정하는 것입니다. 여기에 몇 개의 레이어가 있습니다. 하나는 공여자 반응의 전반적인 강도이며, 이는 측정되는 각 특정 세포의 발현 수준으로 공급된다. 팽창 된 감마가 0 인 Bernoulli 변수를 "공여자의 반응이 측정하기에 충분히 강하다"고 해석하면 문제가 없을 수 있습니다. 이 경우 강력하게 반응하는 공여자 사이의 변화로 개별 세포 발현의 소음을 집중시킵니다. 단일 세포에서 발현되는 잡음은 대략 감마 분포되어 있기 때문에

기증자 대 세포의 추가 변이가 감마 적합을 망치지 않고 발현 대 적용된 펩티드를 얻으려고 시도하는 경우 이것이 괜찮지 않아야 할 이유가 없습니다.

보다 자세한 분석이 필요한 경우 측정으로 이어지는 프로세스와 일치하도록 사용자 지정 계층 모델을 구성하는 것이 좋습니다.


3

나는 다소 우아한 해결책을 찾았습니다. 문헌에는 " 0에 클 럼핑을 갖는 반복 측정 데이터의 분석" 이라는 제목의 우수한 기사가 있는데, 이는 상관 데이터에 대한 0- 팽창 로그 정규 모델을 보여줍니다. 필자는 PROC NLMIXED를 기반으로하는 SAS 매크로를 제공하며 구현하기가 매우 쉽습니다. 좋은 소식은 repeated매크로 에서 문장 을 생략하여 군집 관측없이 사례를 단순화 할 수 있다는 것 입니다. 나쁜 소식은 NLMIXED에는 자동 회귀와 같이 자주 필요한 많은 상관 관계 구조가 아직 없다는 것입니다.

매크로 이름은 MIXCORR이며 여기에서 찾을 수있는 매우 유용한 Wiki 페이지가 있습니다 . 매크로 자체는 여기에서 다운로드 할 수 있습니다 .

이 모든 링크를 적극 권장합니다. 도움이 되길 바랍니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.