«censoring» 태그된 질문

중도 절단 과정은 일부 정보 만 포함하는 데이터를 산출합니다. 가장 일반적인 검열의 예는 생존 분석에서 * 오른쪽 검열 *입니다. 여기서 사건이 발생하기까지의 시간은 연구가 끝났을 때 사건이 발생하지 않았기 때문에 일정 기간보다 긴 것으로 만 알려져 있습니다.

3
예 : 이진 결과에 glmnet을 사용하는 LASSO 회귀
관심있는 결과가 이분법 인 LASSO Regressionglmnet 과 함께 사용하기 시작했습니다 . 아래에 작은 모의 데이터 프레임을 만들었습니다. age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
우리는“연민 공감”에 문제가 있습니까?
나는 이것이 주제가 아닌 것처럼 들릴 수 있지만 내 말을 듣는다. 스택 오버플로에서 게시물에 대한 투표를 받으면 모두 표 형식으로 저장됩니다. 예 : 게시물 유권자 ID 투표 유형 날짜 시간 ------- -------- --------- -------- 1012 2000-1-1 10:00:01 11 3 3 2000-1-1 10:00:01 10 5 2 2000-1-1 10:00:01 ... 등등. 투표 …

3
로지스틱 회귀 95 % 신뢰 구간을 수동으로 계산하는 것과 R에서 confint () 함수를 사용하는 것 사이에 차이가있는 이유는 무엇입니까?
사랑하는 여러분, 제가 설명 할 수없는 이상한 것을 발견했습니다. 요약 : 로지스틱 회귀 모델에서 신뢰 구간을 계산하는 수동 방법과 R 함수 confint()는 다른 결과를 제공합니다. Hosmer & Lemeshow의 Applied Logistic Regression (2 판)을 진행했습니다. 세 번째 장에는 승산 비와 95 % 신뢰 구간을 계산하는 예가 있습니다. R을 사용하면 모델을 쉽게 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
검열과 절단의 차이점은 무엇입니까?
평생 데이터에 대한 통계 모델 및 방법 책에 다음 과 같이 쓰여 있습니다. 검열 : 임의의 원인으로 인해 관측이 완료되지 않은 경우. 잘림 : 관측의 불완전한 특성이 연구 설계 고유의 체계적인 선택 과정으로 인한 경우. 잘림 정의에서 "연구 설계 고유의 체계적인 선택 프로세스"란 무엇입니까? 검열과 절단의 차이점은 무엇입니까?

3
이 홀수 모양 분포를 모델링하는 방법 (거의 J)
아래에 표시된 내 종속 변수는 내가 알고있는 재고 분포와 맞지 않습니다. 선형 회귀는 이상한 Y로 예측 된 Y와 관련하여 다소 비정규의 오른쪽으로 치우친 잔차를 생성합니다 (2 차 플롯). 가장 유효한 결과와 최상의 예측 정확도를 얻을 수있는 변형이나 다른 방법에 대한 제안이 있습니까? 가능한 경우 5 가지 값 (예 : 0, …

3
다중 검열 데이터에 대한 공분산 행렬의 편견 추정
환경 시료의 화학 분석은 종종보고 한계 또는 다양한 검출 / 양자 한계에서 검열됩니다. 후자는 일반적으로 다른 변수의 값에 비례하여 달라질 수 있습니다. 예를 들어, 하나의 화합물이 고농도 인 시료는 분석을 위해 희석해야하므로 해당 시료에서 동시에 분석 된 다른 모든 화합물의 검열 한계가 비례 적으로 팽창합니다. 다른 예로서, 때때로 화합물의 존재는 …

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
“타겟팅 된 최대 가능성 기대치”란 무엇입니까?
Mark van der Laan의 논문을 이해하려고합니다. 그는 Berkeley의 이론적 통계 학자로서 머신 러닝과 상당히 겹치는 문제를 연구하고 있습니다. 저에게있어 한 가지 문제는 (심층 수학 외에도) 완전히 다른 용어를 사용하여 익숙한 기계 학습 접근 방식을 설명하는 경우가 많습니다. 그의 주요 개념 중 하나는 "Targeted Maximum Likelihood Expectation"입니다. TMLE는 혼란스럽지 않은 요인이 …

5
검열 된 데이터는 정확히 무엇입니까?
검열 데이터에 대한 다른 설명을 읽었습니다. A) 이 스레드 에서 설명한 바와 같이, 특정 임계 값 이하의 정량화되지 않은 데이터가 검열됩니다. 정량화되지 않음은 데이터가 특정 임계 값보다 높거나 낮음을 의미하지만 정확한 값을 모릅니다. 그런 다음 회귀 모델 에서 데이터가 하한 또는 상한 임계 값 으로 표시됩니다 . 이 설명과 일치합니다 …

2
생존 분석에서 검열에 대한 Layman의 설명
나는 검열이 무엇인지와 생존 분석에서 어떻게 계산되어야하는지에 대해 읽었지만 그에 대한 수학적 정의가 적고 더 직관적 인 정의를 듣고 싶습니다 (사진은 좋을 것입니다!). 누구든지 1) 검열과 2) Kaplan-Meier 곡선 및 Cox 회귀와 같은 영향에 대한 설명을 제공 할 수 있습니까?

1
종속 변수에 "컷오프"가있는 경우 모델링
내가 사용하는 용어가 틀린 경우 사전에 사과하십시오. 정정을 환영합니다. "잘라 내기"라고 부르는 내용이 다른 이름으로 바뀌면 알려 주시면 질문을 업데이트 할 수 있습니다. 내가 관심있는 상황은 이것입니다. 독립 변수 xx\bf{x} 와 단일 종속 변수 yyy 있습니다. 모호하게 남겨 두 겠지만, 이러한 변수에 대해 좋은 회귀 모델을 얻는 것이 비교적 간단하다고 …

2
연령 그룹 별 그랜드 마스터 타이틀 자격에 대한 평균 연령 편향?
체스 플레이어가 그랜드 마스터 타이틀을 획득 할 수있는 막내 나이가 1950 년대 이래로 상당히 감소한 것으로 알려져 있으며, 현재 15 세 생일 전에 그랜드 마스터가 된 사람은 거의 30 명입니다 . 그러나 Chess Stack Exchange에 질문 이 있는데, 그랜드 마스터가되기위한 평균 연령은 얼마입니까? . 어떤 사람은 자신이 그랜드 마스터의 6 …

1
왼쪽 검열 된 데이터에 표준 기계 학습 도구 사용
수입 업체가 유통 업체의 고객 네트워크에서 제품 수요를 예측할 수 있도록하는 예측 애플리케이션을 개발 중입니다. 판매량은 수요를 충족시키기에 충분한 재고가있는 한 수요에 대한 대리입니다. 하지만 재고를 0으로 낮추면 (고객이 피하는 데 도움이되는 상황) 목표를 놓친 부분을 많이 알지 못합니다. 고객이 얼마나 많은 판매를했을까요? 충분한 공급이 있었습니까? Sales를 간단한 대상 변수로 …

2
JAGS의 검열 / 절단
JAGS에서 검열 문제를 해결하는 방법에 대한 질문이 있습니다. X 값에 측정 오류가있는 이변 량 혼합 법선이 관찰됩니다. 관측 된 검열 된 값의 진정한 기본 '평균'을 모델링하고 싶습니다. ⌈xtrue+ϵ⌉=xobserved ϵ∼N(0,sd=.5)⌈xtrue+ϵ⌉=xobserved ϵ∼N(0,sd=.5)\begin{align*} \lceil x_{true}+\epsilon \rceil = x_{observed} \ \epsilon \sim N(0,sd=.5) \end{align*} 여기 내가 지금 가진 것입니다 : for (i in 1:n){ …

1
무 검정 다변량 법선의 평균과 분산은 무엇입니까?
하자 BE에 . 의 평균 및 공분산 행렬은 무엇입니까 (최대 계산 된 요소 별)?Z∼N(μ,Σ)Z∼N(μ,Σ)Z \sim \mathcal N(\mu, \Sigma)RdRd\mathbb R^dZ+=max(0,Z)Z+=max(0,Z)Z_+ = \max(0, Z) 예를 들어 딥 네트워크 내에서 ReLU 활성화 기능을 사용하고 CLT를 통해 주어진 레이어에 대한 입력이 거의 정상이라고 가정하면 출력 분포입니다. (많은 사람들이 전에 이것을 계산했다고 확신하지만, 합리적으로 읽을 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.