«survival» 태그된 질문

생존 분석은 시간 대 이벤트 데이터, 일반적으로 시간 대 사망 또는 실패 시간을 모델링합니다. 검열 된 데이터는 생존 분석에 일반적인 문제입니다.

8
기존 변수와 정의 된 상관 관계를 갖는 랜덤 변수 생성
시뮬레이션 연구를 위해 기존 변수 와의 미리 정의 된 (인구) 상관 관계를 나타내는 임의의 변수를 생성해야합니다 .YYY I는 들여다 R패키지 copula와 CDVine소정 의존성 구조 랜덤 변수 분포를 생성 할 수있다. 그러나 결과 변수 중 하나를 기존 변수에 고정 할 수 없습니다. 기존 기능에 대한 아이디어와 링크를 부탁드립니다! 결론 : 서로 …



5
콕스 회귀 예측
다변량 콕스 회귀 분석을 수행 중이며 중요한 독립 변수와 베타 값이 있습니다. 이 모델은 내 데이터에 매우 적합합니다. 이제 저는 모델을 사용하고 새로운 관측의 생존을 예측하고 싶습니다. Cox 모델 로이 작업을 수행하는 방법을 잘 모르겠습니다. 선형 또는 로지스틱 회귀 분석에서는 쉬울 것입니다. 회귀 분석에 새로운 관찰 값을 넣고 베타로 곱하면 …

10
생존 시간이 기하 급수적으로 분포 된 것으로 추정되는 이유는 무엇입니까?
UCLA IDRE에 대한이 게시물에서 생존 분석을 배우고 있으며 섹션 1.2.1에서 넘어졌습니다. 튜토리얼은 말합니다 : ... 생존 ​​시간이 기하 급수적으로 분포 된 것으로 알려진 경우, 생존 시간 을 관찰 할 확률은 ... 생존 시간이 기하 급수적으로 분포 된 것으로 추정되는 이유는 무엇입니까? 나에게는 매우 부자연 스럽습니다. 정규 분포가 아닌 이유는 무엇입니까? …

14
생존 분석에 대한 참조
생존 분석에 대해 배울 수있는 좋은 책 / 자습서를 찾고 있습니다. 또한 R에서 생존 분석을 수행하는 것에 대한 참고 자료에 관심이 있습니다.
33 r  survival  references 

3
내 데이터는 어떤 분포를 따르나요?
1000 개의 구성 요소가 있고 이러한 로그에 몇 번의 로그 기록이 실패했는지 기록하고 실패를 기록 할 때마다 팀에서 문제를 해결하는 데 걸린 시간도 추적합니다. 요컨대,이 1000 개의 구성 요소 각각에 대한 복구 시간 (초)을 기록했습니다. 이 질문의 끝에 데이터가 제공됩니다. 나는이 모든 값을 가져다가 사용 R에 컬린과 프레이 그래프를 그린 …

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

1
자유도는 정수가 아닌 숫자 일 수 있습니까?
GAM을 사용할 때 잔여 DF는 (코드의 마지막 줄). 그게 무슨 뜻이야? GAM 예제를 넘어 서면 일반적으로 자유도는 정수가 아닌 숫자 일 수 있습니까?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

2
생존 분석에서 왜 완전 파라 메트릭 모델 대신 세미 파라 메트릭 모델 (Cox 비례 위험)을 사용합니까?
이 질문은 교차 검증에서 답변 될 수 있기 때문에 Mathematics Stack Exchange에서 마이그레이션 되었습니다. 6 년 전에 이주했습니다 . 나는 콕스 비례 위험 모델을 연구 해 왔으며,이 질문은 대부분의 텍스트에서 빛을 발합니다. 콕스는 부분적 우도 법을 사용하여 위험 함수의 계수를 피팅하는 것을 제안했지만 최대 우도 법과 선형 모형을 사용하여 파라 …

2
베이지안 생존 분석 : 제발 Kaplan Meier의 사전을 작성하십시오!
시간 이벤트가있는 올바른 검열 관찰을 고려하십시오 t1,t2,…t1,t2,…t_1, t_2, \dots. 시각 에서 감수성이있는 개인의 수 iii는 ninin_i 이며 시각 에서의 사건 수 iii는 didid_i 입니다. 생존 함수가 단계 함수 경우 Kaplan-Meier 또는 곱 추정기는 자연스럽게 MLE로 발생합니다 . 우도는 인 L ( α ) = Π I ( 1 - α …

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
생존 분석 : 연속 대 이산 시간
생존 분석에서 시간을 연속 또는 불연속으로 처리할지 여부를 결정하는 방법에 대해 혼란스러워합니다. 특히 생존 분석을 사용하여 남학생과 여학생의 생존 (5 세까지)에 미치는 영향이 가장 큰 아동 및 가정 수준 변수를 식별하려고합니다. 아동 연령 (개월), 아동의 생존 여부, 사망 연령 (개월) 및 기타 아동 및 가구 수준 변수에 대한 지표와 함께 …
20 survival  ties 

2
에서 coxph 모델의 요약에 주어진 “
의 coxph 모델 요약에 제공된 R 2 값 은 무엇입니까 ? 예를 들어아르 자형2아르 자형2R^2 Rsquare= 0.186 (max possible= 0.991 ) 나는 어리석게도 그것을 값 으로 원고를 포함 시켰고 , 검토자는 그가 Cox 모델을 위해 개발 된 고전적인 선형 회귀 와 R 2 통계 의 유사성을 알지 못한다고 말했고 , …

3
기차와 테스트로 나누기 전이나 후에 전가?
N ~ 5000의 데이터 세트가 있고 적어도 하나의 중요한 변수에서 약 1/2이 누락되었습니다. 주요 분석 방법은 Cox 비례 위험입니다. 다중 대치를 사용할 계획입니다. 또한 기차와 테스트 세트로 나눌 것입니다. 데이터를 분할 한 다음 별도로 대치해야합니까? 중요하다면 PROC MI에서 사용할 것 입니다 SAS.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.