«bioinformatics» 태그된 질문

분자 생물학, 유전학 및 유전체학과 같은 분야의 데이터를 구성, 유지 및 분석하는 컴퓨팅 및 생물 과학의 교차로에서의 학문

11
Markov 체인 및 숨겨진 Markov 모델 학습을위한 리소스
Markov Chain 및 HMM에 대해 배울 수있는 자료 (자습서, 교과서, 웹 캐스트 등)를 찾고 있습니다. 저의 배경은 생물 학자이며 현재 생물 정보학 관련 프로젝트에 참여하고 있습니다. 또한 Markov 모델 및 HMM을 충분히 이해하는 데 필요한 수학적 배경은 무엇입니까? Google을 사용하여 둘러 보았지만 지금까지 좋은 입문서를 찾지 못했습니다. 나는 여기 누군가가 …

3
로그 변환 예측 변수 및 / 또는 응답의 해석
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
음 이항 분포의 연속 일반화
음 이항 (NB) 분포 는 음이 아닌 정수로 정의되며 확률 질량 함수 k \ in \ mathbb N_0 을 x \ in \ mathbb R _ {\ ge 0}로f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)={\binom {k+r-1}{k}}p^{k}(1-p)^{r}. 바꾸는 음이 아닌 실수에 대한 연속 분포를 고려하는 것이 합리적 입니까? 이항 계수는 (k + 1) \ cdot \ ldots …

4
인공 신경망에서 인간의 뇌에 대해 무엇을 배울 수 있습니까?
질문 / 제목이 구체적이지 않다는 것을 알고 있으므로 다음과 같이 정리하려고합니다. 인공 신경망은 비교적 엄격한 디자인을 가지고 있습니다. 물론, 그들은 일반적으로 생물학의 영향을 받아 실제 신경망의 수학적 모델을 구축하려고 시도하지만 실제 신경망에 대한 우리의 이해는 정확한 모델을 만들기에는 충분하지 않습니다. 따라서 실제 신경망에 "가까운"정확한 모델이나 어떤 것도 상상할 수 없습니다. …

3
비선형 상관 관계를 감지하기위한 MIC 알고리즘을 직관적으로 설명 할 수 있습니까?
최근에는 두 기사를 읽었습니다. 첫 번째 는 상관의 역사에 관한 것이고 두 번째는 는 는 MIC (Maximal Information Coefficient)라는 새로운 방법에 관한 것입니다. 변수 간의 비선형 상관 관계를 추정하기 위해 MIC 방법을 이해하는 데 도움이 필요합니다. 또한 R에서의 사용 지침은 작성자 웹 사이트 ( Downloads 아래 ) 에서 찾을 수 …

2
불균형 데이터 세트에 대한 교육 접근법
불균형 테스트 데이터 세트가 있습니다. 양수 세트는 100 건으로 구성되고 음수 세트는 1500 건으로 구성됩니다. 훈련 측면에는 더 큰 후보 풀이 있습니다. 긍정적 훈련 세트는 1200 건이고 부정적인 훈련 세트는 12000 건입니다. 이런 종류의 시나리오에는 몇 가지 선택이 있습니다. 1) 전체 교육 세트에 가중치 SVM 사용 (P : 1200, N …

4
DNA 시퀀싱을위한 음 이항 분포 구하기
음의 이항 분포는 생물 정보학에서 카운트 데이터 (특히 주어진 실험으로부터 게놈의 주어진 영역 내에서 예상되는 수의 서열 판독 횟수)에 대한 대중적인 모델이되었다. 설명은 다양합니다. 일부는 이것을 포아송 분포와 같이 작동하지만 추가 모수를 가지므로 평균과 반드시 ​​같지 않은 분산으로 실제 분포를 더 자유롭게 모델링 할 수 있습니다. 일부는 이것을 포아송 분포의 …

8
머신 러닝을위한 "핫 알고리즘"은 무엇입니까?
이것은 기계 학습을 배우기 시작한 누군가의 순진한 질문입니다. 저는 요즘 Marsland의 "Machine Learning : 알고리즘 관점"이라는 책을 읽고 있습니다. 소개 책으로 유용하다고 생각하지만 현재는 최상의 결과를 제공하는 고급 알고리즘으로 가고 싶습니다. 나는 주로 생물 정보학에 관심이있다 : 생물학적 네트워크의 클러스터링과 생물학적 염기 서열에서의 패턴 발견, 특히 단일 염기 다형성 (SNP) …

7
통계 이론 및 응용 프로그램에서 이해하기
저는 최근 공학 및 수학을 배경으로 의학 및 생물학 모델링 석사 학위를 취득했습니다. 교육 프로그램에 상당히 많은 수의 수학 통계 (아래 목록 참조) 과정이 포함되어 있었지만 통계와 이론의 적용에 대해 완전히 잃어버린 경우가 종종 있습니다. "순수한"수학과 비교할 때 통계는 실제로 의미가 없습니다. 특히 대부분의 통계 학자 (내 과거 강사를 포함)가 …

2
RNA seq와 ChIP-chip 데이터 세트 사이의 유전자 목록 중복 가능성 계산
이 포럼의 누군가가 유전자 발현 연구에서이 기본적인 문제를 해결해 줄 수 있기를 바랍니다. 나는 실험 조직과 대조 조직의 깊은 시퀀싱을했다. 그런 다음 대조군보다 실험 샘플에서 유전자의 배수 농축 값을 얻었습니다. 기준 게놈에는 ~ 15,000 개의 유전자가 있습니다. 15,000 개 유전자 중 3,000 개가 대조군과 비교하여 관심있는 샘플에서 특정 컷오프 이상으로 …

2
유전자 복제 수준에 따른 농축 분석
생물학적 배경 시간이 지남에 따라 일부 식물 종은 전체 게놈을 복제하여 각 유전자의 추가 사본을 얻는 경향이 있습니다. 이러한 구성의 불안정성으로 인해, 이들 유전자 중 다수가 결실되고 게놈이 재 배열되고 안정화되어 다시 복제 될 준비가된다. 이러한 복제 이벤트는 종 분화 및 침입 이벤트와 관련이 있으며, 이론에 따르면 복제는 식물이 새로운 …


1
Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?
GLMM 형식이 있습니다. lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model) 조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
통계와 정보학의 차이점은 무엇입니까?
우리는 항상 통계가 단지 데이터를 다루고 있다고 말합니다. 그러나 우리는 정보학이 데이터 분석으로부터 지식을 얻고 있다는 것도 알고 있습니다. 예를 들어, 생물 정보학 사람들은 생물학적 통계없이 완전히 갈 수 있습니다. 통계와 정보학의 본질적인 차이점이 무엇인지 알고 싶습니다.

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.