«project-management» 태그된 질문

* 통계적 * 프로젝트에 대한 계산 작업 구성 데이터 저장, 데이터 공유, 코드 리포지토리 등에 대한 질문에 사용합니다. 프로그래밍에 대한 질문이나 통계와 관련이없는 질문은 주제를 벗어납니다.

7
통계 분석 프로젝트를 효율적으로 관리하는 방법은 무엇입니까?
우리는 종종 컴퓨터 과학에서 프로젝트 관리 및 디자인 패턴에 대해 들지만 통계 분석에서는 덜 자주합니다. 그러나 효과적이고 내구성있는 통계 프로젝트를 설계하기위한 결정적인 단계는 일을 체계적으로 유지하는 것입니다. 필자는 종종 별도의 폴더 (원시 데이터 파일, 변환 된 데이터 파일, R 스크립트, 그림, 메모 등)에서 R과 일관된 파일 구성을 사용하도록 권장합니다. 이 …

3
로지스틱 회귀 95 % 신뢰 구간을 수동으로 계산하는 것과 R에서 confint () 함수를 사용하는 것 사이에 차이가있는 이유는 무엇입니까?
사랑하는 여러분, 제가 설명 할 수없는 이상한 것을 발견했습니다. 요약 : 로지스틱 회귀 모델에서 신뢰 구간을 계산하는 수동 방법과 R 함수 confint()는 다른 결과를 제공합니다. Hosmer & Lemeshow의 Applied Logistic Regression (2 판)을 진행했습니다. 세 번째 장에는 승산 비와 95 % 신뢰 구간을 계산하는 예가 있습니다. R을 사용하면 모델을 쉽게 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 


6
연구의 장기 재현성을 높이는 방법 (특히 R과 Sweave 사용)
상황 : 재현 가능한 연구에 대한 이전 질문에 대한 답으로 Jake는 JASA 아카이브를 작성할 때 발견 한 한 가지 문제점은 CRAN 패키지의 버전 및 기본값이 변경되었다는 것입니다. 따라서 해당 아카이브에는 사용한 패키지 버전도 포함됩니다. 사람들이 패키지를 변경하면 비 네트 기반 시스템이 작동하지 않을 수 있습니다 (패키지 내에 패키지 내에 추가 …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

4
R 코드와 출력을 구성하는 효율적인 방법은 무엇입니까? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . 다른 사람들이 R 코드와 출력을 구성하는 방법에 대한 입력을 찾고 있습니다. 현재 연습은 텍스트 파일의 블록으로 코드를 작성하는 것입니다. #================================================= # 19 May …

5
대규모 데이터 세트에 대한 탐색 적 분석을 유지하는 방법은 무엇입니까?
큰 데이터 세트 (많은 샘플, 많은 변수)에 대한 탐색 적 분석을 시작할 때 종종 수백 개의 파생 변수와 톤의 다른 플롯으로 나 자신을 발견하며 실제 상황을 추적 할 수있는 방법이 없습니다. 처음부터 방향이 없기 때문에 코드는 스파게티처럼 끝납니다. 탐색 적 분석을 깔끔하고 깔끔하게 유지하기 위해 권장되는 방법이 있습니까? 특히, 여러 …

10
CSV (쉼표로 구분 된 값) 파일 편집 전략
데이터 분석 프로젝트를 수행 할 때 종종 데이터를 쉼표 또는 탭으로 구분 된 (CSV, TSV) 데이터 파일에 저장합니다. 데이터는 종종 전용 데이터베이스 관리 시스템에 속합니다. 내 응용 프로그램의 많은 경우이 작업을 과도하게 수행 할 수 있습니다. Excel (또는 다른 스프레드 시트 프로그램)에서 CSV 및 TSV 파일을 편집 할 수 있습니다. …

5
데이터를 저장하기위한 단순하고 안정적이며 개방적이며 상호 운용 가능한 일반 텍스트 형식
이전 질문에서 CSV 파일 편집 도구에 대해 물었습니다 . Gavin 은 Duncan Murdoch의 R Help에 대한 의견에 링크하여 데이터 교환 형식이 CSV보다 데이터를 저장하는 것이 더 안정적인 방법이라고 제안했습니다. 일부 응용 프로그램의 경우 전용 데이터베이스 관리 시스템이 필요합니다. 그러나 소규모 데이터 분석 프로젝트의 경우 더 가벼운 것이 더 적합합니다. 파일 …

3
실질적으로 좋은 데이터 분석 프로세스는 무엇입니까?
대부분의 통계 데이터 분석가가 각 데이터 분석 프로젝트를 수행하는 분석 프로세스를 알고 있거나 참조하고 싶습니다. "목록"을 작성하면 데이터 분석 프로젝트를 완료하기 위해 분석가는 다음을 수행해야합니다. 먼저 프로젝트 요구 사항을 수집하고 이전의 요구 사항을 기반으로 데이터 분석 계획 / 설계 실제로 전처리 데이터 데이터 분석 및 그의 분석 결과에 따라 보고서를 …

3
데이터 세트에서 변수 이름 개선
좋은 변수 이름은 다음과 같습니다. a) 짧고 입력하기 쉬운 b) 기억하기 쉬운 c) 이해할 수 있고 의사 소통. 나는 아무것도 잊고 있습니까? 일관성은 찾아야 할 것입니다. 내가 말한 방법은 일관된 명명 규칙이 위의 품질에 기여한다는 것입니다. 일관성은 (b) 리콜 용이성 및 (c) 이해 가능성에 기여하지만, 다른 요소가 종종 더 중요합니다. …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.