통계 및 빅 데이터 distributions

1

을 감안할 때 IID , 그리고 찾고 :N≥30N≥30N\geq30Xn≈N(μX,σ2X)Xn≈N(μX,σX2)X_n\approx\mathcal{N}(\mu_X,\sigma_X^2)μX≈0μX≈0\mu_X \approx 0 정확한 닫힌 형태 분포 근사 YN=∏1NXnYN=∏1NXnY_N=\prod\limits_{1}^{N}{X_n} 동일한 제품의 점근 적 ( 지수 ?) 근사 이것은 일반적인 질문 인 의 특별한 경우 입니다.μX≈0μX≈0\mu_X \approx 0

12 distributions normal-distribution asymptotics approximation

2

가 확률 밀도 함수일 때 를 찾는 방법 은 무엇입니까?

이 문제를 어떻게 해결할 수 있습니까? 중간 방정식이 필요합니다. 아마도 대답은 입니다.−tf(x)−tf(x)-tf(x) ddt[∫∞txf(x)dx]ddt[∫t∞xf(x)dx] \frac{d}{dt} \left [\int_t^\infty xf(x)\,dx \right ] f(x)f(x)f(x) 는 확률 밀도 함수입니다. 즉, 및 \ lim \ limits_ {x \ to \ infty} F (x) = 1limx→∞f(x)=0limx→∞f(x)=0\lim\limits_{x \to \infty} f(x) = 0limx→∞F(x)=1limx→∞F(x)=1\lim\limits_{x \to \infty} F(x) = 1 출처 …

12 probability distributions self-study mathematical-statistics

1

던의 시험 결과를 읽는 방법?

Dunn의 테스트 결과를 어떻게 읽 습니까? 구체적으로, 아래 표의 값은 무엇을 알려줍니까? 나는 4 개의 그룹으로 비모수 적 데이터를 가지고 있으며, 그룹의 분포가 서로 다르고 집계 데이터 세트와 다른지 확인하기 위해 먼저 Kruskal-Wallis 테스트를 수행했습니다. 그런 다음 Dunn의 테스트를 사용하여 서로 다른 그룹과 그렇지 않은 그룹을 확인했습니다. library(dunn.test) dunn.test(data, g=area, …

12 r distributions kruskal-wallis dunn-test

4

정규 분포를 제공하는 독립 분포의 비율

두 개의 독립 정규 분포의 비율은 Cauchy 분포를 제공합니다. t- 분포는 정규 분포를 독립 카이 제곱 분포로 나눈 값입니다. 두 개의 독립 카이 제곱 분포의 비율은 F- 분포를 제공합니다. 평균 및 분산 로 정규 분포 확률 변수를 제공하는 독립 연속 분포 의 비율을 찾고 있습니까?σ 2μμ\muσ2σ2\sigma^2 아마도 가능한 대답이 무한히있을 …

12 probability distributions normal-distribution mathematical-statistics

3

알 수없는 분포의 데이터를 정규화하는 방법

특정 유형의 반복 측정 데이터 중 가장 적절한 특성 분포를 찾으려고합니다. 본질적으로 지질학 분야에서는 종종 사건이 발생한 기간 (암석이 임계 온도 이하로 냉각 됨)을 찾기 위해 표본 (암석 덩어리)에서 광물의 방사성 연대 측정을 사용합니다. 일반적으로 각 샘플에서 여러 (3-10) 측정이 수행됩니다. 그리고, 평균 및 표준 편차 σ 가 취해진 다. …

12 distributions normal-distribution normalization histogram

5

매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?

데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

3

이론, 적합 또는 다른 것에 기초하여 분포를 선택하는 것이 더 낫습니까?

이것은 철학적 질문에 접해 있지만 더 많은 경험을 가진 다른 사람들이 분포 선택에 대해 어떻게 생각하는지에 관심이 있습니다. 어떤 경우에는 이론이 가장 잘 작동 할 수 있음이 분명해 보입니다 (마우스 꼬리 길이는 아마도 정규 분포 일 것입니다). 많은 경우에 데이터 세트를 설명하는 이론이 없을 수도 있으므로 원래 설명하기 위해 개발 …

12 distributions overfitting heuristic

2

왼쪽으로 치우친 데이터에서 평균과 중앙값 사이의 관계는 무엇입니까?

나는 평균 평균 이라고 생각합니다 .≤≤\leq 이 경우입니까?

12 distributions self-study mean skewness median

2

법선의 합에 대한 법선의 합의 비율

다음의 제한 분포 ( ) 를 찾도록 도와주세요 . U n = X 1 + X 2 + … + X nn → ∞n→∞n \rightarrow \infty여기서Xi는 iidN(0,1)입니다.유엔= X1+ X2+ … + X엔엑스삼1+ X삼2+ … X삼엔,Un=X1+X2+…+XnX13+X23+…Xn3, U_n = \frac{X_1 + X_2 + \ldots + X_n}{X_1^3 + X_2^3 + \ldots X_n^3},엑스나는XiX_i엔( 0 …

12 distributions normal-distribution asymptotics

2

비닝 된 데이터의 3 분위를 추정하는 방법은 무엇입니까?

모집단의 4 분의 1 이상을 포함하는 개방 구간에 속하는 경우 3 분위를 결정하는 기술적 트릭이 있습니까 (그래서 구간을 닫고 표준 공식을 사용할 수 없음)? 편집하다 내가 무언가를 잘못 이해했을 때 나는 다소 완전한 맥락을 제공 할 것이다. 두 개의 열과 6 개의 행이있는 테이블에 데이터가 정렬되어 있습니다. 각 열에는 간격 …

12 distributions histogram descriptive-statistics

2

데이터 세트가 주어지면 확률 분포 자동 결정

주어진 데이터 셋 : x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665) .. 모수를 추정하여 가장 적합한 확률 분포 (감마, 베타, 정규, 지수, 포아송, 카이 제곱 등)를 결정하고 싶습니다. R을 사용하여 솔루션을 제공하는 다음 링크에 대한 질문을 이미 알고 있습니다 : https : //.com/questions/2661402/given-a-set-of-random-numbers-drawn-from-a- 연속 일 변량 분포- 제안 된 최상의 솔루션은 다음과 같습니다. > …

12 r matlab distributions

1

정규 분포 분해

이 분포와 독립적 인 두 표본의 차이가 정규 분포와 같이 양의 분포 만 존재합니까? 그렇다면 간단한 형식입니까?

12 distributions probability

1

데이터로부터 분포 추정

에 R의해 생성 된 데이터 샘플이 rnorm(50,0,1)있으므로 데이터가 분명히 정규 분포를 취합니다. 그러나 R데이터에 대한이 배포 정보를 "알지"않습니다. R샘플이 어떤 종류의 분포에서 나오는지 추정 할 수 있는 방법 이 있습니까? 그렇지 않다면이 shapiro.test기능 을 사용 하고 계속 진행할 것입니다.

12 r distributions

1

모멘트 생성 기능의 식별

동일한 순간 생성 기능을 갖는 동일하지 않은 분포가 있습니까?

12 distributions moments mgf

3

매개 변수화 공분산 행렬이있는 양의 k 차원 사분면에 대한 분포는 무엇입니까?

부정적인 시뮬레이션에 대한 그의 문제에 대한 zzk 의 질문 에 이어 , 공분산 행렬 를 설정할 수있는 양의 k 차원 사분면 에서 매개 변수화 된 분포 패밀리가 무엇인지 궁금합니다 . ΣRk+R+k\mathbb{R}_+^kΣΣ\Sigma zzk 에서 설명한 것처럼 의 분포에서 시작 하여 선형 변환 적용하면 작동하지 않습니다. X⟶ Σ 1 / 2 (X-μ)+μRk+R+k\mathbb{R}_+^kX⟶Σ1/2(X−μ)+μX⟶Σ1/2(X−μ)+μX …

12 distributions multivariate-analysis covariance

«distributions» 태그된 질문