«exponential» 태그된 질문

푸 아송 프로세스에서 이벤트 사이의 시간을 설명하는 분포. 기하 분포의 연속 유사체.

4
포아송과 지수 분포의 관계
포아송 분포의 대기 시간은 매개 변수 람다를 사용한 지수 분포입니다. 그러나 나는 그것을 이해하지 못한다. 포아송은 예를 들어 단위 시간당 도착 수를 모델링합니다. 이것은 지수 분포와 어떤 관련이 있습니까? 시간 단위로 k 도착 확률이 P (k) (poisson으로 모델링 됨)이고 k + 1 확률이 P (k + 1)라고 가정하면 지수 분포는 …

10
생존 시간이 기하 급수적으로 분포 된 것으로 추정되는 이유는 무엇입니까?
UCLA IDRE에 대한이 게시물에서 생존 분석을 배우고 있으며 섹션 1.2.1에서 넘어졌습니다. 튜토리얼은 말합니다 : ... 생존 ​​시간이 기하 급수적으로 분포 된 것으로 알려진 경우, 생존 시간 을 관찰 할 확률은 ... 생존 시간이 기하 급수적으로 분포 된 것으로 추정되는 이유는 무엇입니까? 나에게는 매우 부자연 스럽습니다. 정규 분포가 아닌 이유는 무엇입니까? …

6
금액을 무작위로 나누면 지수 분포 (예 : 소득 및 부)가 발생한다는 것을 분석적으로 어떻게 증명할 수 있습니까?
과학 의 현재 기사에서 다음이 제안되고 있습니다. 10,000 명의 사람들 사이에서 5 억의 수입을 무작위로 나눕니다. 모든 사람에게 동등한 50,000의 몫을 줄 수있는 방법은 한 가지뿐입니다. 따라서 수입을 무작위로 배분한다면 평등은 거의 불가능합니다. 그러나 소수의 사람들에게 많은 돈을주고 많은 사람들에게 약간의 돈을 줄 수있는 수많은 방법이 있습니다. 실제로 소득을 분배 …

3
로지스틱 회귀 95 % 신뢰 구간을 수동으로 계산하는 것과 R에서 confint () 함수를 사용하는 것 사이에 차이가있는 이유는 무엇입니까?
사랑하는 여러분, 제가 설명 할 수없는 이상한 것을 발견했습니다. 요약 : 로지스틱 회귀 모델에서 신뢰 구간을 계산하는 수동 방법과 R 함수 confint()는 다른 결과를 제공합니다. Hosmer & Lemeshow의 Applied Logistic Regression (2 판)을 진행했습니다. 세 번째 장에는 승산 비와 95 % 신뢰 구간을 계산하는 예가 있습니다. R을 사용하면 모델을 쉽게 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
치우친 분포에 대한 이상치 탐지
데이터 점으로서의 특이점에 대한 고전적인 정의에서 상하 사 분위의 1.5 * IQR을 능가하는 경우 비대칭 분포가 가정됩니다. 기울어 진 분포 (지수, 포아송, 기하 등)의 경우 원래 함수의 변환을 분석하여 특이 치를 탐지하는 가장 좋은 방법은 무엇입니까? 예를 들어 지수 분포가 느슨하게 분포 된 분포는 로그 함수로 변환 할 수 있습니다.이 …



2
균일 분포에서 지수 분포로 또는 그 반대로
이것은 아마도 사소한 질문,하지만 내 검색을 포함, 지금까지 열매를 맺지되었습니다 이 위키 피 디아 기사 및 "배포판의 대요" 문서 . 경우 균일 한 분포를 가지고, 그 의미 하는가 지수 분포에 따른?XXXeXeXe^X 마찬가지로 가 지수 분포를 따르는 경우 가 균일 분포를 따른다 는 것을 의미 합니까?YYYln(Y)ln(Y)ln(Y)

2
가정 . 확인
다음 진술이 사실임을 확인하는 가장 쉬운 방법 은 무엇입니까 ? 가정 . 확인 \ sum_ {I = 1} ^ {N} (Y_i - Y _ {1}) \ SIM \ 텍스트 감마 {} (N-1, 1) .Y1,…,Yn∼iidExp(1)Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)∑ni=1(Yi−Y(1))∼Gamma(n−1,1)∑i=1n(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1) 참고 Y(1)=min1≤i≤nYiY(1)=min1≤i≤nYiY_{(1)} = \min\limits_{1 \leq i \leq …

2
지수 랜덤 변수의 조건부 기대
임의 변수 ( )의 경우 같아야 무 메모리 속성에 의해 이후의 분포 동일하다 있지만만큼 우측으로 시프트 .X∼Exp(λ)X∼Exp(λ)X\sim \text{Exp}(\lambda)E[X]=1λE[X]=1λ\mathbb{E}[X] = \frac{1}{\lambda}E[X|X>x]E[X|X>x]\mathbb{E}[X|X > x]x+E[X]x+E[X]x + \mathbb{E}[X]X|X>xX|X>xX|X > xXXXxxx 그러나 나는 메모리리스 속성을 사용하여 구체적인 증거를 제공하기 위해 고심하고 있습니다. 도움을 주시면 감사하겠습니다. 감사.

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
의 기대치를 어떻게 계산 합니까?
경우 지수 분포 파라미터와 및 의 서로 무관의 기대 무엇 ( I는 = 1 , . . . , N ) λ X 난XiXiX_i(i=1,...,n)(i=1,...,n)(i=1,...,n)λλ\lambdaXiXiX_i (∑i=1nXi)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 측면에서 과 및 가능한 다른 상수?λnnnλλ\lambda 참고 : 이 질문은 /math//q/12068/4051 에서 수학 답변을 얻었습니다 . 독자들도 그것을 볼 것입니다.

1
지수 랜덤 변수에 대한 달성 가능한 상관 관계
지수 분포 확률 변수 및 쌍에 대해 달성 가능한 상관 범위는 무엇이며 , 여기서 은 비율 매개 변수?X 2 ~ E x p ( λ 2 ) λ 1 , λ 2 > 0X1∼Exp(λ1)X1∼Exp(λ1)X_1 \sim {\rm Exp}(\lambda_1)X2∼Exp(λ2)X2∼Exp(λ2)X_2 \sim {\rm Exp}(\lambda_2)λ1,λ2>0λ1,λ2>0\lambda_1, \lambda_2 > 0

3
역변환보다는 Ahrens and Dieter (1972)의 방법을 사용하는 지수 랜덤 생성기의 장점은 무엇입니까?
내 질문은 R 의 내장 지수 난수 생성기 인 함수에서 영감을 얻었습니다 rexp(). 기하 급수적으로 분포 된 난수를 생성하려고 할 때 많은 교과서 에서이 Wikipedia 페이지에 요약 된 역변환 방법을 권장합니다 . 이 작업을 수행하는 다른 방법이 있다는 것을 알고 있습니다. 특히, R 의 소스 코드는 Ahrens & Dieter (1972) …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.