«normal-distribution» 태그된 질문

정규 분포 또는 가우스 분포에는 대칭 종 모양의 곡선 인 밀도 함수가 있습니다. 통계에서 가장 중요한 분포 중 하나입니다. 정규성 테스트에 대해 질문하려면 [normality] 태그를 사용하십시오.

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
Leptokurtic 분포를 정규로 변환하는 방법은 무엇입니까?
정규성으로 변환하고 싶은 leptokurtic 변수가 있다고 가정합니다. 이 작업을 수행 할 수있는 변형은 무엇입니까? 데이터 변환이 항상 바람직하지는 않지만 학업을 추구함에 따라 데이터를 정상으로 "해머링"한다고 가정합니다. 또한 그림에서 알 수 있듯이 모든 값은 엄격하게 양수입니다. 나는 포함하여 내가 전에 사용 보았다 변환의 다양한 (거의 아무것도 시도 등)이지만 특히 잘 작동하지는 …

4
회귀 잔차 분포 가정
오류에 대한 분포 가정을 배치해야하는 이유, 즉 yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) 왜 쓰지 않습니까 yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , ,yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) 어느 경우 든 입니다. 나는 분포 가정이 데이터가 아니라 설명이 아닌 오류에 관한 것이라고 강조했다 . ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} 나는이 …

1
가우시안 선형 모델에서 F- 검정이 가장 강력한 이유는 무엇입니까?
가우시안 선형 모델 어떤 벡터 공간에 놓여로 가정 와 의 표준 정규 분포 ,의 통계 용 -test 여기서 는 벡터 공간이며, 이탈 통계량 의 일대일 함수 증가입니다 . 이 통계가 H_0에 가장 강력한 검정을 제공한다는 것을 어떻게 알 수 있습니까?Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu \in U\}U⊂WU⊂WU \subset Wf=ϕ(2logsupμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=ϕ(2log⁡supμ∈W,σ>0L(μ,σ|y)supμ∈U,σ>0L(μ,σ|y)).f=\phi\left( 2\log \frac{\sup_{\mu \in W, \sigma>0} …

2
t- 분포 밀도 함수의 직관
학생의 t- 분포에 대해 공부하고 있는데 t- 분포 밀도 함수를 어떻게 도출 할 수 있을지 궁금해지기 시작했습니다 (wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ). f(t)=Γ(v+12)vπ−−√Γ(v2)(1+t2v)−v+12f(t)=Γ(v+12)vπΓ(v2)(1+t2v)−v+12f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}} 여기서 는 자유도이고 는 감마 함수입니다. 이 기능의 직관은 무엇입니까? 이항 분포의 확률 질량 함수를 보면 나에게 의미가 있습니다. 그러나 t- 분포 밀도 함수는 전혀 이해가되지 …

2
데이터에 가우시안 분포가있는 경우 몇 개의 샘플을 특성화합니까?
단일 차원으로 분포 된 가우시안 데이터는이를 특성화하기 위해 두 개의 매개 변수가 필요하며 (평균, 분산), 약 30 개의 무작위로 선택된 샘플이 일반적으로 이러한 매개 변수를 합리적으로 높은 신뢰도로 추정하기에 충분하다는 소문이 있습니다. 그러나 차원 수가 증가하면 어떻게됩니까? 2 차원 (예 : 높이, 무게)에서 "최적의"타원을 지정하려면 5 개의 매개 변수가 필요합니다. …


2
유한 가우시안 혼합물과 가우시안 사이의 거리는 얼마입니까?
알려진 가중치, 평균 및 표준 편차를 가진 유한하게 많은 가우시안이 혼합되어 있다고 가정합니다. 평균이 같지 않습니다. 물론 모멘트는 성분 모멘트의 가중 평균이므로 혼합물의 평균 및 표준 편차를 계산할 수 있습니다. 혼합물은 정규 분포가 아니지만 정상으로부터 얼마나 멀리 떨어져 있습니까? 위의 이미지는 표준 편차 (구성 요소)와 동일한 평균 및 분산을 가진 …

2
스퓨리어스 상관의 예상 값
우리는 그리 크기의 각 샘플 일반 상태에서 독립적으로 분배한다.n ( μ , σ 2 )NNNnnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) 로부터 샘플 우리는 서로 가장 높은 (절대) 피어슨 상관 관계를 가지고있는이 개 샘플을 선택합니다.NNN 이 상관 관계의 예상 값은 얼마입니까? 감사합니다 [PS 이것은 숙제가 아닙니다]

1
가우스 혼합 모델 (GMM) 작업을위한 Python 패키지
파이썬에서 Gaussian Mixture Models (GMMs) 작업에 사용할 수있는 몇 가지 옵션이있는 것 같습니다. 언뜻보기에는 최소한 : PyMix- http: //www.pymix.org/pymix/index.php 혼합물 모델링 도구 - PyEM http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/ Scipy 도구 상자의 일부이며 GMM에에 초점을 맞출 것으로 보인다 지금으로 알려진 : 업데이트 sklearn.mixture . PyPR- http: //pypr.sourceforge.net/ 패턴 인식 및 GMM을 포함한 관련 도구 …




3
평균 및 분산을 알 수없는 정규 분포의 Jeffreys Prior
사전 분포를 읽고 있으며 평균 및 분산이 알려지지 않은 정규 분포 확률 변수의 표본에 대해 Jeffreys를 미리 계산했습니다. 내 계산에 따르면 다음은 Jeffreys 이전에 보유한 것입니다. 여기서 Fisher의 정보 매트릭스입니다.나는p ( μ , σ2) = de t ( 나는)−−−−−√= de t ( 1 / σ2001 / ( 2 σ4))−−−−−−−−−−−−−−−−−−√= 12 …

2
시끄러운 사인파에 대한 확률 분포
측정 오류가있을 때 진동 함수에서 샘플링 지점의 확률 분포를 분석적으로 계산하려고합니다. 나는 "노이즈없이"부분의 확률 분포를 이미 계산했지만 (이 부분을 마지막에 넣겠습니다) "노이즈"를 포함하는 방법을 알 수 없습니다. 수치 추정 더 명확하게 말하면, 단일 사이클 동안 무작위로 포인트를 선택하는 함수가 있다고 상상해보십시오 . 히스토그램에 점을 비우면 분포와 관련이 있습니다.와이( x ) …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.