«resampling» 태그된 질문

리샘플링이 샘플에서 샘플을 가져옵니다. 일반적인 용도는 잭 나이 핑 (하위 샘플을 가져가는 것, 예를 들어 모든 값은 1이지만) 부트 스트랩 (샘플링 및 교체 포함)입니다. 이러한 기법은 분석적으로 도출하기 어렵거나 불가능할 때 샘플링 분포의 강력한 추정치를 제공 할 수 있습니다.

3
순열을 반복하지 않고 R에서 다시 샘플링하는 방법은 무엇입니까?
R에서 set.seed ()를 사용한 다음 샘플 함수를 사용하여 목록을 무작위 화하면 동일한 순열을 생성하지 않을 수 있습니까? 즉 ... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } 이것은 생산 [1] 1 2 0 3 [1] 0 2 1 3 [1] 0 …

1
이 연속 데이터에 부트 스트랩이 적합합니까?
나는 완전한 초보자입니다 :) 약 745,000 명의 인구에서 10,000의 표본 크기로 연구하고 있습니다. 각 샘플은 "백분율 유사성"을 나타냅니다. 대부분의 표본은 약 97 % -98 %이지만 일부는 60 %와 90 % 사이입니다. 즉, 분포가 크게 부정적입니다. 결과의 약 0.6 %는 0 %이지만 샘플과 별도로 처리됩니다. 모든 10,000 샘플의 평균은 97.7 %이며 …

1
부트 스트랩 방법론. 무작위 서브 샘플링 대신“대체로”재 샘플링하는 이유는 무엇입니까?
부트 스트랩 방법은 지난 몇 년 동안 크게 확산되었으며, 특히 추론이 매우 직관적이기 때문에 많이 사용합니다. 그러나 그것은 내가 이해하지 못하는 것입니다. Efron이 단일 관측 값을 무작위로 포함하거나 제외하여 단순히 서브 샘플링 대신 교체로 리샘플링을 수행 한 이유는 무엇입니까? 무작위 서브 샘플링은 매우 좋은 품질을 가지고 있다고 생각합니다. 이는 우리가 …

1
지니 계수 및 오차 한계
각 시점에서 N = 14 카운트의 시계열 데이터가 있으며 각 시점 에서이 추정치에 대한 Gini 계수 및 표준 오류를 계산하려고합니다. 각 시점에서 N = 14 카운트 만 있기 때문에 jackknife 분산을 계산하여 진행했습니다. 즉 톰슨 Ogwang의 식 (7)로부터표준 오차 '지니 인덱스와를 계산하는 편리한 방식'. 여기서G는(N,K는)요소없이 N 값 지니 계수K와 ˉ …

4
리샘플링 된 데이터 세트에 대한 가설 테스트가 널을 너무 자주 거부하는 이유는 무엇입니까?
tl; dr : null에서 생성 된 데이터 세트로 시작하여 대체 사례를 리샘플링하고 각 리 샘플링 된 데이터 세트에 대해 가설 테스트를 수행했습니다. 이 가설 검정은 시간의 5 %를 초과하여 널을 거부합니다. 아래의 매우 간단한 시뮬레이션에서는 데이터 세트를 생성 엑스~ N( 0 , 1 ) ⨿ Y~ N( 0 , 1 …

2
클러스터 수준 또는 개별 수준에서 부트 스트랩해야합니까?
병원에 무작위로 영향을 미치는 병원에 환자가 중첩되어있는 생존 모델이 있습니다. 무작위 효과는 감마 분포이며,이 용어의 '관련성'을 쉽게 이해할 수있는 척도로보고하려고합니다. 중간 위험률 비율 (중간 승률 비율과 약간 비슷 함)을 사용하는 다음 참조를 찾아서 계산했습니다. Bengtsson T, Dribe M : 역사적 방법 43:15, 2010 그러나 이제 부트 스트랩을 사용하여이 추정과 관련된 …

2
리샘플링을위한 좋은 텍스트?
그룹은 적용된 리샘플링 기술에 대한 좋은 소개 텍스트 / 자원을 추천 할 수 있습니까? 특히, 정규성과 같은 가정이 명확하게 위반 될 때 그룹을 비교하기위한 기존의 파라 메트릭 테스트 (예 : t 테스트, ANOVA, ANCOVA)에 대한 대안에 관심이 있습니다. 더 나은 해결 방법에 대해 스스로 교육하고 싶은 문제 유형의 예는 다음과 …

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
부트 스트랩 샘플의 크기
샘플 통계의 분산을 추정하는 수단으로 부트 스트랩에 대해 배우고 있습니다. 하나의 기본적인 의심이 있습니다. http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf 에서 인용 : • 몇 번의 관찰을 다시 샘플링해야합니까? 좋은 제안은 원래 샘플 크기입니다. 원래 샘플에서와 같이 많은 관측 값을 어떻게 리샘플링 할 수 있습니까? 표본 크기가 100이고 평균의 분산을 추정하려고합니다. 총 표본 크기 100에서 …

1
범주 형 변수로 오버 샘플링
약 4000 명의 고객과 두 그룹으로 나뉘어 진 약 4000 명의 고객과 데이터 세트의 균형을 맞추기 위해 오버 샘플링과 언더 샘플링의 조합을 수행하고 싶습니다. 그룹 중 하나의 비율은 약 15 %입니다. SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE )와 ROSE ( http://cran.r-project.org/web/packages/ROSE/를 살펴 보았습니다 . ROSE.pdf ), 그러나 둘 다 기존 관측 값 (예 …

1
부트 스트랩 리샘플링을 사용하여 데이터 집합의 분산에 대한 신뢰 구간을 계산할 수 있습니까?
데이터 세트에서 여러 번 다시 샘플링하고 매번 평균을 계산하면 이러한 평균이 정규 분포를 따릅니다 (CLT 기준). 따라서 데이터 세트의 확률 분포에 대한 가정없이 데이터 세트의 평균에 대한 신뢰 구간을 계산할 수 있습니다. 분산과 비슷한 것을 할 수 있는지 궁금합니다. 즉, 데이터 세트에서 여러 번 리샘플링하고 매번 분산을 계산할 경우 이러한 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.