«distributions» 태그된 질문

분포는 확률 또는 빈도에 대한 수학적 설명입니다.

1
N 정상 iid 제품의 대략적인 분포? 특수한 경우 μ≈0
을 감안할 때 IID , 그리고 찾고 :N≥30N≥30N\geq30Xn≈N(μX,σ2X)Xn≈N(μX,σX2)X_n\approx\mathcal{N}(\mu_X,\sigma_X^2)μX≈0μX≈0\mu_X \approx 0 정확한 닫힌 형태 분포 근사 YN=∏1NXnYN=∏1NXnY_N=\prod\limits_{1}^{N}{X_n} 동일한 제품의 점근 적 ( 지수 ?) 근사 이것은 일반적인 질문 인 의 특별한 경우 입니다.μX≈0μX≈0\mu_X \approx 0

2
가 확률 밀도 함수일 때 를 찾는 방법 은 무엇입니까?
이 문제를 어떻게 해결할 수 있습니까? 중간 방정식이 필요합니다. 아마도 대답은 입니다.−tf(x)−tf(x)-tf(x) ddt[∫∞txf(x)dx]ddt[∫t∞xf(x)dx] \frac{d}{dt} \left [\int_t^\infty xf(x)\,dx \right ] f(x)f(x)f(x) 는 확률 밀도 함수입니다. 즉, 및 \ lim \ limits_ {x \ to \ infty} F (x) = 1limx→∞f(x)=0limx→∞f(x)=0\lim\limits_{x \to \infty} f(x) = 0limx→∞F(x)=1limx→∞F(x)=1\lim\limits_{x \to \infty} F(x) = 1 출처 …

1
던의 시험 결과를 읽는 방법?
Dunn의 테스트 결과를 어떻게 읽 습니까? 구체적으로, 아래 표의 값은 무엇을 알려줍니까? 나는 4 개의 그룹으로 비모수 적 데이터를 가지고 있으며, 그룹의 분포가 서로 다르고 집계 데이터 세트와 다른지 확인하기 위해 먼저 Kruskal-Wallis 테스트를 수행했습니다. 그런 다음 Dunn의 테스트를 사용하여 서로 다른 그룹과 그렇지 않은 그룹을 확인했습니다. library(dunn.test) dunn.test(data, g=area, …

4
정규 분포를 제공하는 독립 분포의 비율
두 개의 독립 정규 분포의 비율은 Cauchy 분포를 제공합니다. t- 분포는 정규 분포를 독립 카이 제곱 분포로 나눈 값입니다. 두 개의 독립 카이 제곱 분포의 비율은 F- 분포를 제공합니다. 평균 및 분산 로 정규 분포 확률 변수를 제공하는 독립 연속 분포 의 비율을 찾고 있습니까?σ 2μμ\muσ2σ2\sigma^2 아마도 가능한 대답이 무한히있을 …

3
알 수없는 분포의 데이터를 정규화하는 방법
특정 유형의 반복 측정 데이터 중 가장 적절한 특성 분포를 찾으려고합니다. 본질적으로 지질학 분야에서는 종종 사건이 발생한 기간 (암석이 임계 온도 이하로 냉각 됨)을 찾기 위해 표본 (암석 덩어리)에서 광물의 방사성 연대 측정을 사용합니다. 일반적으로 각 샘플에서 여러 (3-10) 측정이 수행됩니다. 그리고, 평균 및 표준 편차 σ 가 취해진 다. …

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
이론, 적합 또는 다른 것에 기초하여 분포를 선택하는 것이 더 낫습니까?
이것은 철학적 질문에 접해 있지만 더 많은 경험을 가진 다른 사람들이 분포 선택에 대해 어떻게 생각하는지에 관심이 있습니다. 어떤 경우에는 이론이 가장 잘 작동 할 수 있음이 분명해 보입니다 (마우스 꼬리 길이는 아마도 정규 분포 일 것입니다). 많은 경우에 데이터 세트를 설명하는 이론이 없을 수도 있으므로 원래 설명하기 위해 개발 …



2
비닝 된 데이터의 3 분위를 추정하는 방법은 무엇입니까?
모집단의 4 분의 1 이상을 포함하는 개방 구간에 속하는 경우 3 분위를 결정하는 기술적 트릭이 있습니까 (그래서 구간을 닫고 표준 공식을 사용할 수 없음)? 편집하다 내가 무언가를 잘못 이해했을 때 나는 다소 완전한 맥락을 제공 할 것이다. 두 개의 열과 6 개의 행이있는 테이블에 데이터가 정렬되어 있습니다. 각 열에는 간격 …

2
데이터 세트가 주어지면 확률 분포 자동 결정
주어진 데이터 셋 : x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665) .. 모수를 추정하여 가장 적합한 확률 분포 (감마, 베타, 정규, 지수, 포아송, 카이 제곱 등)를 결정하고 싶습니다. R을 사용하여 솔루션을 제공하는 다음 링크에 대한 질문을 이미 알고 있습니다 : https : //.com/questions/2661402/given-a-set-of-random-numbers-drawn-from-a- 연속 일 변량 분포- 제안 된 최상의 솔루션은 다음과 같습니다. > …


1
데이터로부터 분포 추정
에 R의해 생성 된 데이터 샘플이 rnorm(50,0,1)있으므로 데이터가 분명히 정규 분포를 취합니다. 그러나 R데이터에 대한이 배포 정보를 "알지"않습니다. R샘플이 어떤 종류의 분포에서 나오는지 추정 할 수 있는 방법 이 있습니까? 그렇지 않다면이 shapiro.test기능 을 사용 하고 계속 진행할 것입니다.
12 r  distributions 


3
매개 변수화 공분산 행렬이있는 양의 k 차원 사분면에 대한 분포는 무엇입니까?
부정적인 시뮬레이션에 대한 그의 문제에 대한 zzk 의 질문 에 이어 , 공분산 행렬 를 설정할 수있는 양의 k 차원 사분면 에서 매개 변수화 된 분포 패밀리가 무엇인지 궁금합니다 . ΣRk+R+k\mathbb{R}_+^kΣΣ\Sigma zzk 에서 설명한 것처럼 의 분포에서 시작 하여 선형 변환 적용하면 작동하지 않습니다. X⟶ Σ 1 / 2 (X-μ)+μRk+R+k\mathbb{R}_+^kX⟶Σ1/2(X−μ)+μX⟶Σ1/2(X−μ)+μX …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.