타임 라인 분석


10

몇 년의 출생 코호트 (예 : http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ )의 데이터를 사용하여 개인의 출생 순서와 나중에 비만의 위험 사이의 관계에 대한 연구를 진행하고 있습니다.

주요 과제는 출생 순서가 모체 연령, 젊고 나이 많은 형제 자매 수 및 출생 간격과 같은 다른 기능과 연결되어 있으며 다른 메커니즘을 통해 결과에 영향을 줄 수도 있습니다. 또한, 이러한 것들이 나중에 비만 위험에 미치는 영향은 "지식 아동"(출생 코호트의 참가자)을 포함하여 형제들의 성별 구성에 의해 수정 될 수 있습니다.

각 인덱스 아동에 대해 가족의 모든 출생을 보여주는 타임 라인을 그릴 수 있으며, 모체 연령은 시간 변수에 따라 달라질 수 있습니다.

여기에 이미지 설명을 입력하십시오

이벤트의 순서, 타이밍 및 특성이 모두 중요 할 수있는 이러한 종류의 데이터를 분석하는 방법을 식별하려고합니다. 나는 회원들이 함께 일하는 다양한 응용 프로그램 때문에이 질문을하고 있습니다-누군가를 식별하는 데 더 오래 걸리는 즉각적인 제안이 있다고 생각합니다. 올바른 방향으로 조금이라도 감사하겠습니다.

관련 질문 : 여성의 출생 간격에 대한 데이터를 어떻게 분석해야합니까?


1
+1. 일반적인 질문 : 부모의 BMI에 대한 데이터가 있습니까?
Deer Hunter

예, 인덱스 아동의 어머니에 대한 종 방향 인체 측정 데이터가 있습니다. 안타깝게도 형제 자매에 있지 않고 가족 분석 사이 또는 내부 분석을 배제합니다.
DL Dahly

현재 타임 라인 문제에 대한 유용한 생각이 많지 않습니다. 첫 번째 출산시 다른 독립 변수로 산모 연령을 원할 수도 있습니다. 나는 당신이 이미 탐색 적 분석과 시각화를 수행했다고 가정합니다 ...
Deer Hunter

분명히 모성 연령은 설명해야 할 중요한 요소이므로 위의 타임 라인은 모성 연령을 시간 변수로 사용하는 이유입니다. 내가 찾길 바라고있는 것은 모든 것을 선형 모델에 던지는 것 이상을 제공하는 대체 방법입니다.
DL Dahly

이것이 중요한지는 확실하지 않지만, 출생 체중 또는 여성 아동의 평균 출생 체중은 흥미로운 공변량 일 수 있다고 생각합니다. 또한 결과에 대한 자세한 정보를 제공 할 수 있습니까? 측정을 반복 했습니까?
신뢰할 수있는

답변:


2

다단계 모형 (혼합 회귀)을 사용하여 군간 및 군내 효과를 추정 할 수 있습니다. 가능한 전략 중 하나는 계획된 계층 적 모델 구축 방법을 사용하는 것입니다. 예를 들어 일 변량 모델에서 각 잠재적 예측 변수를 테스트합니다. 가족 간 효과가 출생 순서 효과를 제거하면 출생 순서가 중요하지 않지만 다른 영향이 있음을 강력하게 제안합니다. IQ에 대한 출생지시 효과에 대한 인용의 예 :

도움이 되었기를 바랍니다.


+1도 좋은 아이디어 였지만이 특정 분석을위한 형제 자매에 대한 결과 데이터는 없습니다.
DL Dahly

0

통계적인 질문으로이 문제에 접근하고 있으며 의료 문제에 대한 특별한 지식이 없습니다.

내가 언급 한 기사를 보면 한 집단에 970 명이 포함되어 있음을 알 수 있습니다. 대략 같은 크기의 여러 집단에 대한 데이터가있는 경우 데이터 세트의 전체 크기는 각 개인의 타임 라인이 특정 조건을 충족하는 합리적으로 큰 하위 집합을 선택할 수있는 기회를 제공합니다. 예를 들어, 하위 집합에는 모성 연령이 25-29 세인 모든 남성 개인이 포함될 수 있습니다. 그러한 하위 집단에 대해, 출생 순서에 대한 추후 비만의 적절한 척도의 회귀는 지표 아동의 성별 차이의 비만에 대한 가능한 영향을 제거하고 모체 연령의 가능한 영향을 크게 제거 할 것이다.

하위 집합에 대한 한 가지 조건이 예를 들어 인덱스 하위에 나이가 더 많은 여성 형제가있는 경우 인덱스 하위 자체가 가장 큰 하위가 아니라는 것을 의미하므로 범위를 좁히기 때문에이 접근 방식을 형제의 성별로 확장하는 것은 간단하지 않습니다. 회귀 분석에서 독립 변수의 그러나이 방법을 사용하면 "있는 경우"를 사용하여 조건을 정의 할 수 있습니다. 예를 들어, 25-29 세의 모성 및 모든 형제 자매가있는 여성 (있는 경우)을 포함하는 모든 남성 개인을 포함하도록 하위 집합을 정의 할 수 있습니다. 그러한 하위 집합에는 여전히 모든 출생지시를 가진 개인이 포함됩니다.

부분 집합이 너무 복잡한 조건 세트로 정의 된 경우 포함 된 개인의 수가 너무 작아서 계수의 결과 추정값이 너무 부정확하여 유용하지 않을 수 있습니다. 만약이 접근법이 채택된다면, 가능한 많은 효과를 제거하고 유용한 결과를 산출하기에 충분한 개인을 포함시키는 것 사이에서, 부분 집합을 정의함에있어 판단상의 절충이 필요할 것이다.


답 아담에 감사합니다. 그러나이 경우 샘플을 계층화하면 유사하게 조정 된 모델 이외의 것을 말할 수 있다고 생각하지 않습니다. 올바르게 지정된 선형 모형이이 작업을 수행하는 가장 좋은 방법 일 수 있습니다. 다른 분야의 통계학자가 다른 방식으로 비슷한 문제를 처리했는지 확인하고 싶었습니다.
DL Dahly

나는 이것이 당신이 말하는 것이라면-나의 접근 방식은 수많은 지표 변수를 사용하는 전체 데이터 세트에 대한 단일 회귀와 동등하다는 것에 동의합니다. 모성 연령을 예로 들어, 연속 변수로 취급하는 모든 모델의 잠재적 문제는 기능적 형태에 대한 가정이 필요하다는 것입니다 (모성 연령과 비만 사이의 관계는 곡선적일 수 있음). 대조적으로, 모성 연령대에 지표 변수 세트를 사용하는 모델은 그러한 가정이 필요하지 않으며 그 점에서 더 일반적입니다.
Adam Bailey

0

기능적 데이터 분석을 제안하지만 합리적인 추정치를 얻기에는 자녀가 너무 적은 가족이 많을 것으로 생각됩니다. 그래도 필요에 따라 계속 읽어보십시오. 아마도 누군가가 이미 비슷한 데이터로 그것을 사용했을 것입니다.

파라 메트릭 이외의 작업을 원하지 않으면 임상 전문 지식을 사용하여 데이터의 차원을 줄여야합니다. 예를 들어, 모델의 한 변수는 자식 수이고 다른 변수는 자식 사이의 평균 년 수 등일 수 있습니다. 이러한 변수에 영향이있는 경우 기능 양식을 즉시 지정하지 않은 경우에도 표시 될 수 있습니다. 더 많은 지식 중심 모델 구축을 통해 매우 예측 가능한 모델을 구축 할 수 있습니다. 검증 세트를 유지해야합니다!


FDA를 사용하는데 어떻게 적용되는지 잘 모르겠습니다. 각 인덱스 하위에 대해 x 축 = 0을 설정할 수 있으며 해당 축에 +/- 시간에 다른 형제 자매가 표시됩니다. y 축으로서 모체 연령을 갖는다; 그런 다음 각 인덱스 하위에 대한 단조 함수형 데이터 객체를 추정하지만 ...이 작업을 수행하자마자 실제 형제 수와 줄을 따라 떨어진 위치에 대한 모든 정보를 잃어 버렸습니다 (모든 것이 이제 요약되어 있기 때문에 함수). FDA에는 여러 가지 분석 모드가 포함되어 있습니다. 더 구체적으로 생각한 것이 있습니까?
DL Dahly
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.