~ 2,500 명의 개인으로부터 ~ 7,500 개의 혈액 검사가 포함 된 데이터 집합이 있습니다. 혈액 검사의 변동성이 두 검사 사이의 시간에 따라 증가 또는 감소하는지 확인하려고합니다. 예를 들어-기준선 테스트를 위해 혈액을 채취 한 다음 즉시 두 번째 샘플을 채취합니다. 6 개월 후, 나는 또 다른 샘플을 그립니다. 기준 및 즉시 반복 시험의 차이가 기준 및 6 개월 시험의 차이보다 작을 것으로 예상 할 수 있습니다.
아래 그림의 각 지점은 두 테스트의 차이점을 반영합니다. X는 두 테스트 사이의 일 수입니다. Y는 두 검정의 차이 크기입니다. 보시다시피, 테스트는 X를 따라 균등하게 분배되지 않습니다. 연구는 실제로이 질문을 해결하도록 설계되지 않았습니다. 점이 평균에 너무 많이 쌓여 있기 때문에 28 일의 창을 기준으로 95 % (파란색) 및 99 % (빨간색) Quantile 선을 포함 시켰습니다. 이것들은 더 극단적 인 점에 의해 분명히 풀리지 만 아이디어를 얻습니다.
대체 텍스트 http://a.imageshack.us/img175/6595/diffsbydays.png
가변성이 상당히 안정적인 것처럼 보입니다. 어쨌든 짧은 기간 내에 테스트를 반복하면 훨씬 더 직관적입니다. 각 시점 (및 테스트가없는 일부 기간)에서 n의 변화를 고려하여 체계적인 방식으로이 문제를 어떻게 해결할 수 있습니까? 당신의 아이디어는 대단히 감사합니다.
참고로, 이것은 테스트와 재 테스트 사이의 일수 분포입니다.
대체 텍스트 http://a.imageshack.us/img697/6572/testsateachtimepoint.png