«stata» 태그된 질문

통계 소프트웨어 패키지. (a) Stata를 질문의 중요한 부분 또는 예상 답변으로 포함시키는 주제별 질문에이 태그를 사용하십시오. (b) Stata를 사용하는 방법에 관한 것이 아닙니다.

25
통계 워크 벤치로서의 파이썬
많은 사람들이 통계 요구에 Excel 또는 다른 스프레드 시트, SPSS, Stata 또는 R과 같은 기본 도구를 사용합니다. 매우 특별한 요구를 위해 특정 패키지로 전환 할 수 있지만 간단한 스프레드 시트 또는 일반 통계 패키지 또는 통계 프로그래밍 환경을 사용하여 많은 작업을 수행 할 수 있습니다. 저는 항상 파이썬을 프로그래밍 언어로 …
355 r  spss  stata  python 

3
로그 변환 예측 변수 및 / 또는 응답의 해석
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
R에서 Stata의 "견고한"옵션 복제
robustR 에서 Stata 옵션의 결과를 복제하려고했습니다 rlm. MASS 패키지와 lmrob"robustbase"패키지 의 명령 을 사용했습니다. 두 경우 모두 결과는 Stata의 "robust"옵션과 상당히 다릅니다. 이 맥락에서 누군가 제안 할 수 있습니까? Stata에서 강력한 옵션을 실행할 때 얻은 결과는 다음과 같습니다. . reg yb7 buildsqb7 no_bed no_bath rain_harv swim_pl pr_terrace, robust Linear regression …

4
2x2보다 큰 우발 상황 테이블에서 Fisher의 정확한 테스트
피셔의 정확한 테스트를 2x2 인 비상 대표에만 적용하도록 배웠습니다. 질문 : Fisher 자신도이 테스트를 2x2보다 큰 테이블에서 사용하도록 구상 했습니까? ( 노인이 차에 차 를 넣었 는지, 차에 차 를 넣었 는지 여부를 알 수있을 때 시험을 고안하는 이야기를 알고 있습니다. ) Stata를 사용하면 Fisher의 정확한 테스트를 모든 우발 상황 …

1
자유도는 정수가 아닌 숫자 일 수 있습니까?
GAM을 사용할 때 잔여 DF는 (코드의 마지막 줄). 그게 무슨 뜻이야? GAM 예제를 넘어 서면 일반적으로 자유도는 정수가 아닌 숫자 일 수 있습니까?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

2
데이터의 일부 변동에도 불구하고 혼합 모델에서 랜덤 효과의 분산이 0 인 이유는 무엇입니까?
다음 구문을 사용하여 혼합 효과 로지스틱 회귀 분석을 실행했습니다. # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) 주제와 항목은 무작위 효과입니다. 주제 항에 대한 계수와 표준 편차가 모두 0 인 홀수 결과를 얻습니다. Generalized linear mixed …

1
교호 작용을 포함 할 수있는 양방향 ANOVA의 비모수 적 요소는 무엇입니까?
안녕하세요, 나는 상호 작용을 포함 할 수있는 양방향 ANOVA (3x4 디자인)의 비 매개 변수를 찾으려고합니다. Zar 1984의 "Biostatistical analysis"에서 읽은 내용은 Scheirer, Ray, Hare (1976)에서 제시된 방법을 사용하여 가능하지만 온라인의 다른 게시물에 따르면이 방법은 더 이상 적절하지 않다고 추론되었습니다 였다). 누구든지 그렇게하는 데 어떤 방법이 적합한 지 알고 있다면 R …

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
어떤 GLM 제품군의 사용을 검증 할 수있는 진단은 무엇입니까?
이것은 매우 기초적인 것처럼 보이지만 항상이 시점에서 멈춰 있습니다. 내가 다루는 대부분의 데이터는 비정규 적이며 대부분의 분석은 GLM 구조를 기반으로합니다. 현재 분석을 위해 "보행 속도"(미터 / 분) 인 응답 변수가 있습니다. OLS를 사용할 수 없다는 것을 쉽게 알 수 있지만 어떤 가족 (감마, Weibull 등)이 적합한 지 결정하는 데 큰 …


4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
2SLS이지만 2 단계 프로 빗
관측 변수로 인과 관계를 유추하기 위해 도구 변수 분석을 사용하려고합니다. 나는 내 연구에서 내 생성 문제를 해결할 수있는 2 단계 최소 제곱 (2SLS) 회귀를 겪었습니다. 그러나 1 단계는 OLS가되고 2 단계는 2SLS 내에서 프로 빗이되고 싶습니다. 필자는 읽기와 검색을 바탕으로 연구원들이 2SLS 또는 1 단계 프로 빗 및 2 단계 …

5
시계열을 어떻게 추론합니까?
시계열을 어떻게 추론합니까? 첫 번째 차이를보고 Dickey Fuller 테스트를 실행해도 괜찮습니까? 또한 Stata 에서이 작업을 수행하여 시계열을 추론 할 수 있음을 온라인에서 발견했습니다. reg lncredit time predict u_lncredit, residuals twoway line u_lncredit time dfuller u_lncredit, drift regress lags(0) 시계열을 추론하는 가장 좋은 방법은 무엇입니까?

4
패널 데이터와 일치하는 성향 점수
나는 개인의 종단 데이터 세트를 가지고 있으며 그들 중 일부는 치료를 받았으며 다른 사람들은 그렇지 않았습니다. 모든 개인은 출생부터 18 세까지의 표본에 있으며 치료는 그 범위 사이의 어떤 나이에 발생합니다. 치료 기간은 사례마다 다를 수 있습니다. 성향 점수 일치를 사용하여 출생 연도부터 18 세까지 각 쌍을 추적 할 수 있도록 …

2
Stata에서 프로 빗 모델을 어떻게 해석합니까?
Stata에서 실행 한이 probit 회귀를 해석하는 방법을 잘 모르겠습니다. 데이터는 대출 승인 상태이며 흰색은 더미 변수로, 사람이 백인이면 = 1이고 사람이 그렇지 않은 경우 = 0입니다. 이것을 읽는 방법에 대한 도움을 주시면 감사하겠습니다. 내가 주로 찾고있는 것은 백인과 비백 인 모두에 대한 대출 승인 가능성을 찾는 방법입니다. 누군가가 여기에있는 텍스트와 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.