«mathematical-statistics» 태그된 질문

공식적인 정의 및 일반적인 결과와 관련된 통계의 수학적 이론.

1
TF-IDF 로그에서 로그 사용 이해
나는 읽고 있었다: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition 그러나 수식이 왜 원래대로 구성되었는지 정확히 이해할 수없는 것 같습니다. 내가 이해하는 것 : iDF는 어떤 수준에서 용어 S가 각 문서에 나타나는 빈도를 측정해야하며, 용어가 더 자주 나타날수록 가치가 감소합니다. 그 관점에서 나는 D F( S) = # 문서의# S를 포함하는 서류나는디에프(에스)=# 문서# S가 포함 된 …

1
정보 기하학의 설명
이 질문은 Amari 의 곡선 형 지수 패밀리 곡률 및 정보 손실의 차등 형상에 관한 것 입니다. 텍스트는 다음과 같습니다. 하자 수 좌표계 함께 확률 분포의 차원 매니 , 으로 가정합니다 ...에스엔= { pθ}Sn={pθ}S^n=\{p_{\theta}\}엔엔nθ = ( θ1, … , θ엔)θ=(θ1,…,θ엔)\theta=(\theta_1,\dots,\theta_n)피θ( x ) > 0피θ(엑스)>0p_{\theta}(x)>0 우리는 모든 점 간주있다 의 함수 …

2
한 표본 t- 검정에서 분산 추정기에서 표본 평균이 대체되면 어떻게됩니까 ?
귀무 가설이 1- 표본 t- 검정을 가정 합니다. 그런 다음 표본 표준 편차 사용하여 통계는 입니다. 추정 할 때 관측 값을 표본 평균 과 비교합니다 .μ=μ0μ=μ0\mu=\mu_0t=x¯¯¯−μ0s/n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s=1n−1∑ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} 입니다. 그러나 주어진 이 참 이라고 가정 하면 표본 평균 대신 사용하여 표준 편차 를 추정 할 수도 있습니다 .μ0μ0\mu_0s∗s∗s^*μ0μ0\mu_0x¯¯¯x¯\overline{x} s∗=1n−1∑ni=1(xi−μ0)2−−−−−−−−−−−−−−−−√s∗=1n−1∑i=1n(xi−μ0)2s^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\mu_0)^2} …

2
로지스틱 함수로 변환 된 가우스 랜덤 변수의 예상 값
로지스틱 함수와 표준 편차는 일반적으로 로 표시 됩니다. 내가 사용합니다 및 표준 편차.σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss 내 말은 임의의 입력과 물류 신경이 과 표준 편차 내가 알고 있습니다. 평균과의 차이가 일부 가우시안 노이즈에 의해 대략적으로 추정 될 수 있기를 바랍니다. 따라서 약간의 표기법 남용으로 생성한다고 가정합니다 . 의 예상 값은 무엇입니까 …

1
student-t 오류가있는 회귀는 쓸모 없습니까?
편집을 참조하십시오. 꼬리가 굵은 데이터가있는 경우 student-t 오류로 회귀를 수행하는 것은 직관적 인 방법으로 보입니다. 이 가능성을 탐구하는 동안 나는이 논문에 부딪쳤다. Breusch, TS, Robertson, JC, & Welsh, AH (1997 년 11 월 1 일). 황제의 새로운 옷 : 다변량 회귀 모델에 대한 비판. Statistica Neerlandica, 51, 3.) ( link …

2
가설 검정 및 총 변동 거리 대 Kullback-Leibler 발산
내 연구에서 나는 다음과 같은 일반적인 문제를 겪었 습니다. 동일한 도메인에 대해 두 개의 분포 PPP 와 QQQ 가 있고 그 분포에서 많은 (그러나 유한 한) 샘플 수가 있습니다. 표본은이 두 분포 중 하나에서 독립적으로 동일하게 분포됩니다 (분포는 관련 될 수 있지만, 예를 들어 QQQ 는 PPP 와 다른 분포 …


3
가 독립 변수 인 경우 분포
일상적인 연습으로, 의 분포를 찾으려고합니다. 여기서 와 는 독립적 인 임의 변수입니다.X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2}XXXYYYU(0,1)U(0,1) U(0,1) 의 접합 밀도 는 (X,Y)(X,Y)(X,Y)fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right)cosθcos⁡θ\cos\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]zsinθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right)sinθsin⁡θ\sin\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right] 따라서 경우 .1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2cos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right) 변환의 자코비 안의 절대 값은|J|=z|J|=z|J|=z 따라서 공동 밀도 주어진다(Z,Θ)(Z,Θ)(Z,\Theta) fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} 통합하면 과 같이 의 pdf를 얻습니다.θθ\thetaZZZ fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1(1z))11&lt;z&lt;2√fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1⁡(1z))11&lt;z&lt;2f_Z(z)=\frac{\pi z}{2}\mathbf 1_{0\sqrt 2 \end{cases} 올바른 표현처럼 보입니다. 사례 …


1
감마 분포의 적합 그래프와 실제 그래프를 한 플롯에 그리는 방법은 무엇입니까?
필요한 패키지를로드하십시오. library(ggplot2) library(MASS) 감마 분포에 적합한 10,000 개의 숫자를 생성합니다. x &lt;- round(rgamma(100000,shape = 2,rate = 0.2),1) x &lt;- x[which(x&gt;0)] 우리가 어느 분포 x에 적합한지를 모르는 확률 밀도 함수를 그립니다. t1 &lt;- as.data.frame(table(x)) names(t1) &lt;- c("x","y") t1 &lt;- transform(t1,x=as.numeric(as.character(x))) t1$y &lt;- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y …

4
R의 이산 시간 이벤트 기록 (생존) 모델
R에 이산 시간 모델을 맞추려고하지만 어떻게 해야할지 모르겠습니다. 종속 변수를 각 시간 관찰마다 하나씩 다른 행 glm으로 구성하고 logit 또는 cloglog 링크와 함께 함수를 사용할 수 있다는 것을 읽었습니다. 이런 의미에서, 나는 세 개의 열이 있습니다 : ID, Event(각 시간 경과시 1 또는 0) 및 Time Elapsed(관측 시작부터 ) 그리고 …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
샘플 자기 공분산 함수에 대한 질문
시계열 분석 책을 읽고 있는데 샘플 자기 공분산 공식은 다음과 같이 책에 정의되어 있습니다. γˆ( h ) =엔− 1∑t = 1n - h(엑스t + h−엑스¯) (엑스티−엑스¯)γ^(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x}) 와 γˆ( − h ) =γˆ( h )γ^(−h)=γ^(h)\widehat{\gamma}(-h) = \widehat{\gamma}(h)\; ...에 대한 H = 0 , 1 , . . . , …

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
시퀀스 감소 증명 (많은 pt를 플로팅하여 지원)
지난 달에 SE에 게시 한 많은 질문은이 특정 문제를 해결하는 데 도움이되는 목표였습니다. 모든 질문에 대답했지만 여전히 해결책을 찾지 못했습니다. 그래서 직접 해결하려고하는 문제를 물어봐야한다고 생각했습니다. 하자 . 여기서 , , (정수)이며 모든 은 .엑스엔∼에프엔Xn∼FnX_n \sim F_n에프엔= ( 1 − ( 1 −에프n - 1)씨)씨Fn=(1−(1−Fn−1)c)cF_n = (1-(1-F_{n-1})^c)^c에프0= xF0=xF_0 = xc …

2
iid Gaussians의 최대 값에 대한 가장 강력한 결과는 무엇입니까? 실제로 가장 많이 사용됩니까?
iid가 주어지면 임의의 변수를 고려하십시오.X1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) Zn:=max1≤i≤nXi.Zn:=max1≤i≤nXi. Z_n := \max_{1 \le i \le n} X_i\,. 질문 : 이 랜덤 변수에 대한 가장 "중요한"결과는 무엇입니까? "중요도"를 명확하게하기 위해 어떤 결과가 논리적 결과와 같은 다른 결과를 가져 오는가? 실제로 가장 많이 사용되는 결과는 무엇입니까? 보다 구체적으로, (이론적) 통계 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.