긍정적이고 중요하지 않은 결과가 많이있는 경우 "적어도 결과가 긍정적"인지 테스트 할 수 있습니까?


9

100 명의 다른 개인에 대해 동일한 회귀 분석을 개별적으로 실행했다고 가정하겠습니다. 내 관심 계수는 양수 (그리고 서로 상당히 다름)이지만 100 개 결과 모두에서 통계적으로 중요하지 않습니다 (모든 p- 값 = 0.11이라고 말하십시오).

p = 0.11보다 더 큰 의미로 "최소한 80 개의 결과가 긍정적"이라는 결론을 내리기 위해 이러한 p- 값을 결합하는 방법이 있습니까? 온라인 검색에서 Fisher 또는 유사한 테스트를 통해 "적어도 1 개 이상의 결과가 긍정적"이라고 말하는 방법 만 보여 주었지만 그 결과를 일반화 할 수 없었습니다. "HA = 80 개 이상의 효과가 양수입니다."에 대해 "H0 = 모든 100 개 효과가 0에서 동일 함"을 테스트하고 싶습니다.

내 목표는 평균적으로 양의 계수가 있다고 말하지 않으며 계수를 구체적으로 측정하는 것도 아닙니다. 저의 목표는 80 명 이상, 각 개인이 느끼는 효과의 크기에 관계없이 80 명 이상이 개별적으로 긍정적 인 효과에 직면했음을 의미하는 것으로 입증하는 것입니다.


2
"100 명의 개인에 대해 동일한 회귀 분석을 별도로 실행"한다는 것은 무슨 의미입니까? -이는 동일한 반응 변수 및 설명 변수 세트에서 각각 여러 개의 관측 값을 갖는 100 개의 데이터 세트가 있음을 의미합니까? 예를 들어 개인의 키와 몸무게를 비교하는 데 관심이있는 경우 어떻게 작동하는지 확실하지 않은 경우 각 개인에 대해 하나의 관측치 만 있으므로 회귀 분석에 어떻게 적합합니까? 각 개인마다 시계열이 있습니까?이 경우 어쨌든 더 정교한 기술이 필요합니다. 검색어를 찾고 있다면 그것은 종 방향 분석의 한 형태 일 것입니다.
피터 엘리스

답변:


8

관심 계수 랜덤 변수 자체를 사용하여 100 개의 모든 분석을 단일 혼합 효과 모델로 수행해야합니다. 이렇게하면 전체 평균을 포함하여 해당 계수에 대한 분포를 추정 할 수 있습니다.

내가 생각하는 것처럼 각 개인에 대한 시계열이있는 경우 잔차의 자기 상관도 수정해야합니다.


시간 내 주셔서 감사합니다. 대단히 감사합니다. 명확히하면 시계열입니다. 5 년 동안 100 명 모두에 대한 데이터를 가지고 있고 3 년째에 더미 변수 (관심있는 독립 변수)가 100 명 모두에 대해 동시에 1로 변경된다고 가정 해 봅시다. 나는 그 변화가 각 사람에게 미치는 정확한 영향이나 평균 효과에 대해서는 신경 쓰지 않습니다. 오히려, 나는 적어도 80 명이 각각 영향을 받았다는 것을 확인하고 싶습니다. 계수는 모두 100에서 양수이지만 각각은 중요하지 않습니다. 계수의 분포를 측정하면 그 결과를 얻을 수 있을지 모르겠습니다.
user28239

1
그게 당신이 가진 것 같아요. 내 권장 방법이 맞다고 생각합니다. 그런 다음 모델을 사용하여 예측 또는 원하는 다른 해석을 수행 할 수 있습니다.
피터 엘리스

4

간단한 할 일이 아마 기호 테스트 될 것입니다. 귀무 가설은 각 결과가 공정한 동전 뒤집기와 같이 양수 또는 음수 일 확률이 동일하다는 것입니다. 목표는이 귀무 가설 하에서 관측 된 결과가 불충분 할 가능성이 있는지 여부를 결정하는 것입니다.

공정한 동전 100 뒤집기에서 80 개 이상의 헤드를 얻을 확률은 얼마입니까? 이항 분포를 사용하여이를 계산할 수 있습니다. 이어 R, 관련 함수가 호출되고 pbinom, 당신은 다음 코드 줄을 사용하여 (하나는 양면) p- 값을 얻을 수 있습니다 :

pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)

이 테스트에 따르면, 직감이 맞습니다. 치료가 효과가 없다면 우연히 80 개의 긍정적 인 결과를 얻지 못할 것입니다.

밀접하게 관련된 옵션은 Wilcoxon signed rank test 와 같은 것을 사용하는 것 입니다.


더 나은 당신이 실제로 효과의 크기를 추정 (보다는 그냥 0보다 큰 여부를 경향이 있는지 여부를 확인) 할 경우 접근 방법은, 아마 계층 ( "혼합") 모델이 될 것입니다.

여기서 모델은 100 명의 개인의 결과가 분포에서 나온 것이며 목표는 해당 분포의 평균이 어디에 있는지 (신뢰 구간과 함께) 확인하는 것입니다.

혼합 모델을 사용하면 효과 크기에 대해 좀 더 말할 수 있습니다. 모델을 피팅 한 후에는 "데이터가 실제 평균과 일치하더라도 처리 결과가 평균 3 단위로 개선되는 경향이 있다고 추정 할 수 있습니다. 효과 크기는 1.5에서 4.5 단위에 달합니다. 또한 개인마다 약간의 차이가 있기 때문에 주어진 사람은 -0.5에서 +6.5 단위에 영향을 줄 수 있습니다. "

그것은 매우 정확하고 유용한 진술입니다. 단지 "효과는 아마 긍정적이고 평균"인 것보다 훨씬 낫기 때문에 통계 학자들이이 접근법을 선호하는 이유입니다. 그러나 모든 세부 사항이 필요하지 않은 경우, 내가 언급 한 첫 번째 접근 방식도 괜찮을 수 있습니다.


0

어쩌면 나는 그것이 완전히 잘못되었을 수도 있지만, 나에게 보이는 것은 당신이 반복 측정 ANOVA를 시도하고 있다는 것입니다. 이 "더미"를 대상 내 요인으로 정의하면 나머지는 모델이 수행합니다. 의의 자체는 그다지 유익하지 않습니다. 필요하지만 충분하지 않습니다. 관측치가 충분히 많으면 모든 모형이 중요해집니다. 효과가 얼마나 큰지에 대한 아이디어를 얻기 위해 (부분) Eta-Squared와 같은 효과 크기를 얻을 수 있습니다. 내 2 센트


0

일반적인 ANCOVA 계산만큼 간단하지만 데이터를 분석하는 적절한 방법은 실제 상황에 따라 다르며 세부 정보를 제공하지 않았습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.