무작위 모집단 샘플을 조사했다. 그들은 채식을 먹는지 물었습니다. 그들이 예라고 대답하면, 그들은 중단없이 채식을 얼마나 오랫동안 먹었는지 명시하도록 요청 받았다. 이 데이터를 사용하여 채식주의에 대한 평균 준수 기간을 계산하고 싶습니다. 다시 말해, 누군가 채식을하면 평균적으로 채식을한다는 것을 알고 싶습니다. 다음과 같이 가정 해 봅시다 :
- 모든 응답자가 정확하고 정확한 답변을하였습니다
- 세계는 안정적입니다. 채식의 인기는 변하지 않으며 평균 준수 기간도 변하지 않습니다.
지금까지 나의 추론
저는 매년 초에 두 사람이 채식주의자가되는 세상의 장난감 모델을 분석하는 것이 도움이된다는 것을 알게되었습니다. 매번 그들 중 하나는 1 년 동안 채식을하고 다른 한 사람은 3 년 동안 채식을합니다. 분명히이 세상에서 평균 준수 기간은 (1 + 3) / 2 = 2 년입니다. 다음은 예제를 보여주는 그래프입니다. 각 사각형은 채식주의 기간을 나타냅니다.
4 년 중반에 설문 조사를한다고 가정 해 봅시다 (빨간 선). 우리는 다음과 같은 데이터를 얻습니다.
우리가 3 년을 시작하여 어느 해에 설문 조사를하더라도 동일한 데이터를 얻을 것입니다.
(2 * 0.5 + 1.5 + 2.5) / 4 = 1.25
우리는 조사 직후 모두가 채식을 중단했다고 가정하기 때문에 과소 평가합니다. 이 참가자들이 채식을하는 실제 평균 시간에 가까운 추정치를 얻으려면 평균적으로 채식 기간의 절반 정도 시간을보고하고보고 된 기간에 2를 곱한 것으로 가정 할 수 있습니다. 인구 (내가 분석하는 것과 같은)에서 나는 이것이 현실적인 가정이라고 생각합니다. 적어도 올바른 예상 값을 제공합니다. 그러나 배가가 우리의 유일한 일이라면 평균 2.5를 얻습니다. 사람이 채식을 오래할수록 현재 채식인의 표본에 더 많이 참여할 가능성이 있기 때문입니다.
그런 다음 누군가가 현재 채식인의 표본에있을 확률이 채식 기간에 비례한다고 생각했습니다. 이 편견을 설명하기 위해, 나는 현재 채식인의 수를 예측 된 준수 기간으로 나누려고했습니다.
그러나 이것은 또한 잘못된 평균을 제공합니다.
(2 * 1 + ⅓ * 3 + ⅕ * 5) / (2 + ⅓ + ⅕) = 4 / 2.533333 = 1.579 년
채식주의 자의 수를 올바른 준수 기간으로 나눈 경우 올바른 추정치를 제공합니다.
(1 + ⅓ * (1 + 3 + 5)) / (1 + ⅓ * 3) = 2 년
그러나 예측 된 준수 길이를 사용하면 실제로 작동하지 않습니다. 나는 무엇을 시도 해야할지 모르겠다. 생존 분석에 대해 조금 읽었지만이 경우 어떻게 적용할지 잘 모르겠습니다. 이상적으로는 90 % 신뢰 구간을 계산할 수 있기를 원합니다. 모든 팁을 주시면 감사하겠습니다.
편집 : 위의 질문에 답이 없을 수도 있습니다. 그러나 사람들이 채식주의 자인지, 과거에 몇 번이나 채식주의 자인지에 대한 무작위 표본을 요구하는 또 다른 연구 도 있었습니다. 나는 또한 연구와 다른 것들에서 모두의 나이를 알고 있습니다. 어쩌면이 정보는 어떻게 든 평균을 얻기 위해 현재 채식주의 자의 설문 조사와 함께 사용될 수 있습니다. 실제로, 내가 말한 연구는 퍼즐의 한 조각 일 뿐이지 만 매우 중요한 연구이며 더 많은 것을 얻고 싶습니다.