«genetics» 태그된 질문

유전의 원리와 관련 유기체 간의 유전 형질의 변이에 대한 과학적 연구.

6
머신 러닝에서 교차 검증을 수행 할 때 "최종"모델을위한 기능 선택
기능 선택 및 기계 학습에 대해 약간 혼란스러워하며 도움이되는지 궁금합니다. 두 그룹으로 분류되고 1000 개의 기능을 가진 마이크로 어레이 데이터 세트가 있습니다. 내 목표는 이론적으로 다른 데이터 세트에 적용하여 해당 샘플을 최적으로 분류 할 수있는 서명으로 소수의 유전자 (내 특징) (10-20)를 얻는 것입니다. 샘플 수가 많지 않기 때문에 (<100), 테스트 …

6
1300 년에 태어난 특정 인물의 후손 일 가능성이 얼마나됩니까?
즉, 다음을 기준으로 p 란 무엇입니까? 이 문제를 인류학이나 사회 과학이 아닌 수학 문제로 만들고 문제를 단순화하기 위해 형제와 첫 번째 사촌이 결코 짝을 이루지 않고 항상 동일한 항목에서 선택된다는 점을 제외하고는 모집단 전체에서 동일한 확률로 메이트를 선택한다고 가정합니다. 세대. n1n1n_1 초기 인구 ggg 숫자 생성 ccc 부부 당 평균 …

4
테스트가 서로 관련되어있는 여러 테스트 (유전학)에 대한 p 값 수정
많은 테스트에서 p 값이 있으며 여러 테스트를 수정 한 후 실제로 중요한 것이 있는지 알고 싶습니다. 합병증 : 내 테스트는 독립적이지 않습니다. 내가 생각하고있는 방법 (Fisher 's Product Method의 변형, Zaykin et al., Genet Epidemiol , 2002)은 p 값 사이의 상관 관계가 필요합니다. 이 상관 관계를 추정하기 위해 현재 부트 …

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


1
양자화 정규화는 어떻게 작동합니까?
마이크로 어레이를 사용한 유전자 발현 연구에서, 강도 데이터는 정규화되어야 개체간에, 유전자 사이에서 강도를 비교할 수있다. 개념적이고 알고리즘 적으로 "양자 정규화"는 어떻게 작동하며 이것을 비 통계 전문가에게 어떻게 설명 하시겠습니까?

2
RNA seq와 ChIP-chip 데이터 세트 사이의 유전자 목록 중복 가능성 계산
이 포럼의 누군가가 유전자 발현 연구에서이 기본적인 문제를 해결해 줄 수 있기를 바랍니다. 나는 실험 조직과 대조 조직의 깊은 시퀀싱을했다. 그런 다음 대조군보다 실험 샘플에서 유전자의 배수 농축 값을 얻었습니다. 기준 게놈에는 ~ 15,000 개의 유전자가 있습니다. 15,000 개 유전자 중 3,000 개가 대조군과 비교하여 관심있는 샘플에서 특정 컷오프 이상으로 …

2
유전자 복제 수준에 따른 농축 분석
생물학적 배경 시간이 지남에 따라 일부 식물 종은 전체 게놈을 복제하여 각 유전자의 추가 사본을 얻는 경향이 있습니다. 이러한 구성의 불안정성으로 인해, 이들 유전자 중 다수가 결실되고 게놈이 재 배열되고 안정화되어 다시 복제 될 준비가된다. 이러한 복제 이벤트는 종 분화 및 침입 이벤트와 관련이 있으며, 이론에 따르면 복제는 식물이 새로운 …

1
생존 분석을위한 전력 분석
유전자 시그니처가 재발 위험이 낮은 대상을 식별한다고 가정하면, 이는 인구의 20 %에서 사건 비율이 0.5 (위험 비율 0.5) 감소하고 후 향적 코호트 연구의 샘플을 사용하려는 것입니다. 가정 된 두 그룹에서 동일하지 않은 숫자에 대해 표본 크기를 조정해야합니까? 예를 들어 Collett, D : Medical Research의 생존 데이터 모델링, 제 2 판-제 …


2
소프트 임계 값 대 올가미 벌점
지금까지 고차원 데이터 세트를 사용하여 불이익을받은 다변량 분석에서 이해 한 내용을 요약하려고하지만 소프트 임계 값 대 Lasso (또는 ) 불이익에 대한 적절한 정의를 얻는 데 어려움을 겪고 있습니다.L1L1L_1 보다 정확하게는, 희소 한 PLS 회귀 분석을 사용하여 게놈 데이터 ( 단일 뉴클레오티드 다형성 , 우리는 수치 변수로 간주되는 {0,1,2} 범위의 작은 …

3
PCA를 통한 마할 라 노비스 거리
나는 행렬을 가지고 있는데, 여기서 는 유전자의 수이고 은 환자의 수입니다. 그러한 데이터로 작업 한 사람은 가 항상 보다 크다는 것을 알고 있습니다. 기능 선택을 사용하여 를 더 합리적인 수로 줄 였지만 는 여전히 보다 큽니다 .n × pn×pn\times p피pp엔nn피pp엔nn피pp피pp엔nn 나는 그들의 유전자 프로필을 기반으로 환자의 유사성을 계산하고 싶습니다; 유클리드 …

1
승산 비의 표준 오차를 계산하는 방법?
게놈 전체 협회 연구에서 얻은 두 가지 데이터 세트가 있습니다. 사용 가능한 유일한 정보는 승산 비와 첫 번째 데이터 세트의 p- 값입니다. 두 번째 데이터 세트의 경우 확률 비, p- 값 및 대립 유전자 빈도 (AFD = 질환, AFC = 대조군)가 있습니다 (예 : 0.321). 이 데이터의 메타 분석을 시도하고 …

1
아이들은 어떻게 GWAS 데이터 세트의 PCA 프로젝션에서 부모를 어떻게 함께 모을 수 있습니까?
에서 각 좌표 iid로 10,000 차원 공간에서 20 개의 임의의 점을 취합니다 . 10 쌍 ( "커플")으로 나누고 각 쌍의 평균 ( "자식")을 데이터 세트에 추가하십시오. 그런 다음 결과 30 점에서 PCA를 수행하고 PC1 대 PC2를 플로팅합니다.엔( 0 , 1 )N(0,1)\mathcal N(0,1) 놀라운 일이 일어납니다. 각 "가족"은 서로 가까이있는 삼중점을 …

4
메타 분석에서 풀링 된 홀수 비율의 신뢰 구간을 계산하는 방법은 무엇입니까?
게놈 전체 협회 연구에서 얻은 두 가지 데이터 세트가 있습니다. 이용 가능한 유일한 정보는 각 유전자형 SNP에 대한 홀수 비율과 신뢰 구간 (95 %)입니다. 이 두 배당률을 비교하는 포레스트 플롯을 생성하고 싶지만 요약 효과를 시각화하기 위해 결합 된 신뢰 구간을 계산하는 방법을 찾을 수 없습니다. 고정 효과를 사용하여 메타 분석을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.