관찰 된 대립 유전자 빈도가 예측 된 것보다 현저히 낮습니까?


10

질문 : 나는이 생태 선택 모델 (그림 2) 예상보다 훨씬 남쪽 산 중앙 낮다 "산"-allele 주파수 (그림 1)을 준수하는지 확인하는 테스트를 만들 수있는 방법 ( 자세한 내용은 아래를 참조하십시오 )?

문제점 : 저의 초기 생각은 위도 : 경도 및 고도에 대한 모형 잔차를 회귀하는 것입니다 (위도와 경도 사이의 상호 작용 만 중요 함). 문제는 잔차 (그림 3)가 모델에 의해 설명되지 않은 변형을 반영 할 수 있고 그리고 / 또는 그것들이 생물학적으로 발생하고 있다는 것입니다. 관측 된 (그림 1) 대 예상 된 (대표 2) 산 대립 유전자 빈도를 비교하면 특히 스웨덴과 노르웨이의 중앙 산과 남쪽 산에서 뚜렷한 차이가 있습니다. 모델이 모든 변형을 설명 할 수는 없지만 산 대립이 남쪽 산의 중앙에서 잠재력에 도달하지 않았다는 아이디어를 탐색하기 위해 합리적인 테스트를 수행 할 수 있습니까?

배경: 나는 스칸디나비아 반도의 저지대 서식지와 산 (및 위도 : 경도)과 관련된 빈도 분포를 보이는 이중 대립 AFLP 마커를 가지고 있습니다 (그림 1). "산"대립 유전자는 북쪽에 거의 고정되어 있으며 산이 많다. 산이 결여 된 남쪽의 "대지"대립 유전자에 대해서는 거의 결석하거나 고정되어있다. 산에서 북쪽에서 남쪽으로 움직일 때 "산"대립 유전자는 더 낮은 빈도로 발생합니다. 북쪽에서 남쪽으로의 "산"대립 유전자 빈도의 차이는이 지역이 북쪽과 남쪽에서 식민지로 되었기 때문에 단순히 물리학 또는 역사적 과정으로 인한 것일 수 있습니다. 예를 들어, 산 대립 유전자가 북부 인구에서 시작된 경우 남부 인구로 완전히 확장 할 시간이 없었을 수 있습니다.

나의 작업 가설은 "산"대립 유전자 빈도가 생태 선택의 결과라는 것이다 (널 가설은 중립 선택이다).

생태 선택 모델의 경우, 이항 대립 유전자 빈도 를 반응 변수 (각각 사이트에서 일반적으로 10-20 명의 개체가 샘플링 된 Fennoscandinavia에서 샘플링 된 129 개 사이트) 및 여러 기후 및 성장 계절 변수로 일반 첨가 모델 (GAM)을 사용 했습니다. 예측 변수 모델 결과는 다음과 같습니다 (TMAX04-06 = 4 월 -6 월의 최고 온도, Phen_NPPMN = 평균 성장 계절 식물 생산성, PET_HE_YR = 연간 잠재적 증발산, Dist_Coast = 해안까지의 거리) :

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

여기에 이미지 설명을 입력하십시오

그림 1. 이중 대립 AFLP 마커에 대해 관찰 된 "산"대립 유전자 빈도. 등고선 0.1 주파수 간격, 색상 음영은 파란색이 가장 낮고 빨간색이 가장 높습니다.

여기에 이미지 설명을 입력하십시오

그림 2. 이중 대립 AFLP 마커에 대해 예측 된 "산"대립 유전자 빈도. 등고선 0.1 주파수 간격, 색상 음영은 파란색이 가장 낮고 빨간색이 가장 높습니다.

여기에 이미지 설명을 입력하십시오

그림 3. 생태 학적 선택 모델 (GAM 사용) 잔차는 전체 연구 지역 (Fennoscandinavia)과 노르웨이, 스웨덴 및 핀란드에 대해 별도로 분류되었습니다. 빨간색 파선은 다른 AFLP 마커에서 유추 된 북부와 남부 인구 사이의 2 차 접촉 구역을 나타내며 아프리카의 별도의 동계에서 자란 깃털의 안정한 동위 원소 분석입니다. 가는 검은 색 점선은 영역의 중심입니다.


1
많은 세부 사항에 감사드립니다. null 모델은 어떻게 문제에 빠 집니까? 생태적 선택 모델 만이 관찰 된 것과 기대 된 것을 비교하는 데 중요한 것으로 보인다.
gui11aume

실제 데이터는 무엇입니까? 모델 출력에 "n = 129"라고 표시되어 있지만 대립 유전자 빈도가있는 129 명의 개인 또는 129 개의 위치입니까?
onestop

죄송합니다. 제가 개발중인 원고에 대한 나의 접근 방식의 논리 (또는 비논리적)를 가장 잘 이해할 수 있도록 가능한 한 많은 배경을 제공하고 싶었습니다. 내 질문은 맨 위에 있으며 관찰과 예상의 차이가 크게 다른지 여부를 결정하는 이유를 찾고 싶습니다. 이것은 대립 유전자가 여전히 퍼져 있는지 또는 예상 값에 도달하는 데 약간의 장벽이 있는지 알려줍니다. "N = 129"의 경우, 이것은 대립 유전자 빈도이므로, 이는 각각의 부위에서 전형적으로 10 내지 20 명의 개체가 샘플링 된 129 개의 부위를 의미한다.
Keith Larson

당신은 개인이 모체와 상 염색체 유전자좌에 대해 패닉 상태 인 것으로 보입니다. 이 데이터에 액세스 할 수 있습니까? panmixia를 어떻게 평가 했습니까?
Sameer

답변:


1

이 질문은 죽었을지도 모르지만 여기의 그래프는 화려하며 여기의 대답은 직관적으로 명백합니다. "산"대립 유전자를 찾고 있다면, 명백한 선택은 예측 자로서 고도 (또는 그 일부 대리)를 사용하는 것입니다. 이것이 대립 유전자 빈도와 유의 한 연관성을 보이면 가설에 대한 강력한 증거가 될 것입니다.

지형의 "거칠음"또는 초목 유형과 같이 고도 이외의 산의 다른 측면을 설명하는 예측 변수를 더 많이 추가하여 고유하게 산이 있고 대립 유전자 빈도와 관련 될 수도 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.