«distributions» 태그된 질문

분포는 확률 또는 빈도에 대한 수학적 설명입니다.

3
분포는 정확히 무엇입니까?
나는 확률과 통계에 대해 거의 알지 못하고 배우고 싶습니다. 나는 "배포"라는 단어가 다른 상황에서 사방에 사용 된 것을 본다. 예를 들어, 이산 랜덤 변수에는 "확률 분포"가 있습니다. 나는 이것이 무엇인지 안다. 연속 확률 변수는 들어, 확률 밀도 함수를 갖는 적분에서 에 확률 밀도 함수에서 평가 누적 분포 함수이고 .x∈Rx∈Rx\in\mathbb{R}−∞−∞-\inftyxxxxxx 그리고 …

5
표본의 표본 추출 분포는 모집단 평균과 어떻게 비슷합니까?
통계를 배우려고 노력하고 있는데, 그것이 제대로 이해되지 않으면 어떤 것들을 배우지 못하게 막는 것이 널리 퍼져 있기 때문입니다. 샘플 수단의 샘플링 분포에 대한이 개념을 이해하는 데 어려움이 있습니다. 일부 책과 사이트에서 설명하는 방식을 이해할 수 없습니다. 나는 이해가 있다고 생각하지만 그것이 정확한지 확실하지 않습니다. 아래는 그것을 이해하려는 시도입니다. 정규 분포를 …

2
서버 응답 시간을 모델링하는 데 가장 일반적으로 사용되는 배포는 무엇입니까?
서블릿 기반 응용 프로그램이 있는데,이 서블릿에 대한 각 요청을 완료하는 데 걸린 시간을 측정합니다. 평균과 최대 값과 같은 간단한 통계를 이미 계산했습니다. 그러나 좀 더 정교한 분석을 만들고 싶습니다. 그렇게하려면 이러한 응답 시간을 올바르게 모델링해야한다고 생각합니다. 확실히, 응답 시간은 잘 알려진 분포를 따르며, 분포가 올바른 모형이라고 믿을만한 충분한 이유가 있습니다. …

2
브라운 다리의 최상부에 왜 콜로 모고 로프-스 미르 노프 분포가 있는가?
Kolmogorov–Smirnov 분포는 Kolmogorov–Smirnov 검정 에서 알려져 있습니다 . 그러나 그것은 또한 브라운 다리의 최고의 분포입니다. 이것은 나에게 명백하지 않기 때문에,이 우연의 일치에 대한 직관적 인 설명을 부탁드립니다. 참조도 환영합니다.

2
정규 분포의 두 번째 모수는 분산 또는 표준 편차입니까?
때로는 교과서가 정규 분포의 두 번째 매개 변수를 표준 편차 및 분산으로 참조하는 것을 보았습니다. 예를 들어, 랜덤 변수 X ~ N (0, 4)입니다. 시그마 또는 시그마 제곱이 4인지 여부는 확실하지 않습니다. 표준 편차 나 분산이 지정되지 않은 경우 사용되는 일반적인 규칙을 찾으려고합니다.

2
기차가 오기 전에 시간을 모델링하는 데 사용할 분포는 무엇입니까?
기차 도착 시간에 대한 일부 데이터를 모델링하려고합니다. "기다리는 시간이 길수록 열차가 나타날 가능성이 높다"는 내용 의 배포판을 사용하고 싶습니다 . P (train show up | 60 분 기다림)가 1에 가까워 지도록 그러한 분포가 CDF처럼 보일 것 같습니다. 여기서 사용하기에 적합한 분포는 무엇입니까?


4
반복 횟수가 증가함에 따라 그라디언트 부스팅 기계 정확도가 감소합니다.
caretR 의 패키지를 통해 그라디언트 부스팅 머신 알고리즘을 실험하고 있습니다 . 소규모 대학 입학 데이터 세트를 사용하여 다음 코드를 실행했습니다. library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
부적절한 분포에서 샘플링 (MCMC 등 사용)
내 기본 질문은 : 어떻게 당신은 부적절한 배포판에서 샘플링 할 것입니까? 부적절한 분포에서 표본을 추출하는 것이 합리적입니까? Xi'an의 의견은 여기에 일종의 질문을 제기하지만 이에 대한 자세한 내용을 찾고있었습니다. MCMC에보다 구체적 : MCMC에 대해 이야기하고 논문을 읽을 때 저자들은 적절한 후방 분포를 얻는 것에 중점을 둡니다. 유명한 Geyer (1992) 논문이 있는데, …

1
통계 알고리즘 개발자 후보에 대한 좋은 인터뷰 질문은 무엇입니까?
통계 / 기계 학습 / 데이터 마이닝 컨텍스트에서 알고리즘 개발자 / 연구원의 위치에 대해 사람들을 인터뷰하고 있습니다. 나는 기본 이론에 대한 후보의 친숙성, 이해 및 유동성, 예를 들어 기대 및 분산의 기본 특성, 일부 공통 분포 등을 결정하기 위해 질문을 찾고 있습니다. 나의 현재 이동-에 대한 질문은 : "알 수없는 …

5
다양한 다면체 주사위의 분포는 한 번에 무엇입니까?
던전 앤 드래곤 주사위 세트에서 5 개의 플라톤 고체를 가져 가십시오. 이들은 4면, 6면 (기존), 8면, 12면 및 20면 주사위로 구성됩니다. 모두 1에서 시작하여 총계에서 1까지 증가합니다. 한 번에 모두 굴려서 합계를 가져옵니다 (최소 합계는 5, 최대는 50입니다). 여러 번 그렇게하십시오. 분포는 무엇입니까? 분명히 그것들은 더 높은 숫자보다 더 낮은 …

2
다른 분포의 중간 절대 편차 (MAD) 및 SD
정규 분포 데이터의 경우 표준 편차 및 중앙 절대 편차 는 다음과 관련이 있습니다.σσ\sigmaMADMAD\text{MAD} σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,σ=Φ−1(3/4)⋅MAD≈1.4826⋅MAD,\sigma=\Phi^{-1}(3/4)\cdot \text{MAD}\approx1.4826\cdot\text{MAD}, 여기서 는 표준 정규 분포에 대한 누적 분포 함수입니다.Φ ( )Φ()\Phi() 다른 배포판과 비슷한 관계가 있습니까?

2
샘플링 분포는 추론에 합법적인가?
일부 베이지안들은 연구자의 의도에 따라 "독특한 샘플링 분포가 없다"는 잦은 추론을 공격한다 (Kruschke, Aguinis, & Joo, 2012, p. 733). 예를 들어 한 연구원이 데이터 수집을 시작했지만 40 명이 참여한 후 그의 자금이 예기치 않게 삭감되었다고 가정 해 보겠습니다. 샘플링 분포 (및 후속 CI 및 p- 값)는 어떻게 여기에서도 정의됩니까? 각 …

4
변환 할 때 비정규 데이터를 유지하는 비정규 데이터에 대해 회귀를 수행하려면 어떻게해야합니까?
21 개 설문지 항목에 대한 리 커트 척도 답변에서 파생 된 일부 데이터 (158 건)가 있습니다. 설문지의 어떤 항목이 전체 항목에 대한 응답을 예측하는지 확인하기 위해 회귀 분석을 수행하고 싶습니다 (만족도). 응답은 (KS 테스트에 따라) 정상적으로 배포되지 않으며 내가 생각할 수있는 모든 방식 (역, 로그, log10, sqrt, 제곱)으로 변환했으며 정규 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.