«computational-statistics» 태그된 질문

통계 및 컴퓨팅의 인터페이스를 나타냅니다. 통계 목적으로 알고리즘 및 소프트웨어 사용.

21
Julia는 통계 커뮤니티를 고수 할 희망이 있습니까?
최근에 R-Bloggers의 게시물을 읽었으며 John Myles White 의이 블로그 게시물에 Julia 라는 새로운 언어에 대한 링크가 있습니다 . Julia는 JIT (Just-In-Time) 컴파일러를 활용하여 악의적 인 빠른 실행 시간을 제공하고 C / C ++와 동일한 속도의 속도를 제공합니다 (동일한 순서). , 동등하게 빨리하지 않음). 또한 R의 apply 문과 벡터 연산 대신 …

9
시계열에서 이상을 탐지하기 위해 어떤 알고리즘을 사용해야합니까?
배경 Network Operations Center에서 일하고 있으며 컴퓨터 시스템 및 성능을 모니터링합니다. 모니터링 할 주요 지표 중 하나는 현재 서버에 연결된 많은 방문자 / 고객입니다. 이를 보이기 위해 (Ops 팀) 시계열 데이터와 같은 메트릭을 수집하고 그래프를 그립니다. Graphite 는 우리가 그것을 할 수있게 해줍니다.이 API는 갑작스런 하락 (주로) 및 기타 변경이 …

8
통계 워크 벤치로서의 Excel
많은 사람들 (나를 포함하여)은 Excel에서 탐색 적 데이터 분석을 좋아하는 것 같습니다. 스프레드 시트에서 허용되는 행 수와 같은 일부 제한 사항은 고통 스럽지만 대부분의 경우 Excel을 사용하여 데이터를 처리하는 것이 불가능하지는 않습니다. 그러나 McCullough와 Heiser의 논문은 실제로 Excel을 사용하려고하면 결과가 잘못 될 수도 있고, 아마도 지옥에서도 불 타올 것이라고 비명을 …


7
플립의 수가 증가함에 따라 꼬리와 같은 수의 머리를 뒤집을 가능성이 적은 이유를 설명하는 통계 개념?
저는 몇 권의 책을 읽고 코드를 작성하여 확률과 통계를 배우고 있습니다. 동전 뒤집기를 시뮬레이션하는 동안 나는 순진한 직관에 약간 반하는 것으로 나타났습니다. 공정한 동전을 번 뒤집 으면 머리와 꼬리의 비율 은 예상 대로 증가함에 따라 1로 수렴 합니다. 그러나 다른 한편으로, 증가함에 따라 꼬리와 같은 수의 머리를 뒤집을 가능성 이 …

12
값 스트림에 대한 기본 통계를 계산하는 명령 줄 도구 [닫기]
표준 입력에서 숫자의 흐름 (ASCII 형식)을 허용하고 최소, 최대, 평균, 중앙값, RMS, Quantile 등과 같은이 흐름에 대한 기본 설명 통계를 제공하는 명령 줄 도구가 있습니까? 명령 행 체인의 다음 명령으로 출력을 구문 분석 할 수 있습니다. 작업 환경은 Linux이지만 다른 옵션도 환영합니다.

4
엣지 케이스의 정밀도 및 리콜에 대한 올바른 값은 무엇입니까?
정밀도는 다음과 같이 정의됩니다. p = true positives / (true positives + false positives) 로, 즉를 정확 true positives하고 false positives, 정밀도가 한 접근 방식 0? 리콜에 대한 동일한 질문 : r = true positives / (true positives + false negatives) 현재이 값을 계산 해야하는 통계 테스트를 구현 중이며 때로는 …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
데이터를 계산하기 위해 불연속 분포를 맞추는 방법은 무엇입니까?
다음과 같은 카운트 데이터 히스토그램이 있습니다. 그리고 나는 이것에 개별 분포를 적용하고 싶습니다. 어떻게해야할지 모르겠습니다. 먼저 히스토그램에 불연속 분포와 같은 불연속 분포를 중첩하여 이산 분포의 모수를 구한 다음 Kolmogorov–Smirnov 검정을 실행하여 p- 값을 확인해야합니까? 이 방법이 올바른지 확실하지 않습니다. 이와 같은 문제를 해결하는 일반적인 방법이 있습니까? 카운트 데이터의 빈도 표입니다. …

1
lmer 모델에 사용할 다중 비교 방법 : lsmeans 또는 glht?
하나의 고정 효과 (조건)와 두 개의 임의 효과 (대상 내 설계 및 쌍으로 인해 참가자)가있는 혼합 효과 모델을 사용하여 데이터 세트를 분석하고 있습니다. lme4패키지로 모델이 생성되었습니다 exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). 다음으로, 고정 효과 (조건)없이 모형에 대해이 모형의 우도 비 검정을 수행했으며 유의 한 차이가 있습니다. 내 데이터 세트에는 3 가지 조건이 있으므로 다중 …

2
계산 통계에서 난수 생성의 중요한 용도는 무엇입니까?
계산 통계에서 난수 생성기 (RNG)가 어떻게 그리고 왜 중요합니까? 나는 어느 가설에 대한 편견을 피하기 위해 많은 통계 테스트를 위해 샘플을 선택할 때 무작위성이 중요하다는 것을 이해하지만 난수 생성기가 중요한 다른 계산 통계 영역이 있습니까?

1
확률 적 경사 하강은 어떻게 표준 경사 하강에 비해 시간을 절약 할 수 있습니까?
표준 그라디언트 디센트는 전체 교육 데이터 세트에 대한 그라디언트를 계산합니다. for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad 사전 정의 된 에포크 수에 대해 먼저 매개 변수 벡터 매개 변수를 사용하여 전체 데이터 세트에 대한 손실 함수의 기울기 벡터 weights_grad를 계산합니다. 대조적으로 …

2
ABC와 MCMC의 응용 프로그램은 어떻게 다릅니 까?
대략적인 베이지안 계산 (ABC)과 마르코프 체인 몬테 카를로 (MCMC)는 비슷한 목표를 가지고 있습니다. 아래에서는 이러한 방법에 대한 이해와 실제 데이터에 대한 응용 프로그램의 차이점을 어떻게 인식하는지 설명합니다. 대략적인 베이지안 계산 ABC는 수치 시뮬레이션을 통해 관측 된 와 비교되는 통계 를 계산하여 이전 의 매개 변수 를 샘플링하는 것으로 구성됩니다 . …

3
일부는 Google 문서 스프레드 시트를 사용하여 통계 작업을 수행하고 다른 사람과 공유합니까?
대부분의 사용자는 Google 문서 도구가 여전히 기본 도구라고 생각합니다. Matlab 또는 R이 아니며 Excel조차도 아닙니다. 그러나 브라우저의 작동 기능 만 사용하는 (그리고 매우 다르게 작동하는 많은 브라우저와 호환되는)이 웹 기반 소프트웨어의 힘에 당황합니다. 이 포럼에서 활동중인 Mike Lawrence는 Google 문서 도구를 사용하여 아주 멋진 작업을 수행하면서 스프레드 시트를 공유했습니다. 필자는 …

9
컴퓨터 과학에 적용되는 전산 통계에 대한 개요를 제공하는 책은 무엇입니까?
저는 소프트웨어 엔지니어로서 통계 알고리즘, 데이터 마이닝, 기계 학습, 베이지안 네트워크, 분류 알고리즘, 신경망, Markov 체인, Monte Carlo 방법 및 난수 생성과 같은 주제에 관심이 있습니다. 개인적으로 이러한 기술을 직접 사용하는 것은 즐겁지 않았지만, 그 기술을 사용하고 그에 대해 더 많이 알고 싶어하는 소프트웨어를 높은 수준에서 사용해야했습니다. 큰 폭의 책을 …

4
R에서 관측치 및 / 또는 예측 변수를 추가 할 때 선형 회귀를 효율적으로 업데이트
관측치 또는 예측 변수를 추가 할 때 선형 모델을 효율적으로 업데이트하기 위해 R에서 방법을 찾는 데 관심이 있습니다. biglm에는 관측치를 추가 할 때 업데이트 기능이 있지만 내 데이터는 메모리에 상주 할 정도로 작습니다 (업데이트 할 인스턴스가 많지만). QR 인수 분해 업데이트 (예 : Hammarling 및 Lucas의 "QR 인수 분해 및 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.