통계 및 빅 데이터

3

부트 스트래핑, 순열 테스트, 잭나이프 등과 같이 실제로 자주 사용되는 몇 가지 널리 사용되는 리샘플링 기술이 있습니다. 필립 I 굿 (2010) 순열, 매개 변수 및 부트 스트랩 테스트와 같은 많은 기사와 서적에서 이러한 기술에 대해 설명합니다. 가설 내 질문은 어떤 리샘플링 기술이 더 인기를 얻고 구현하기가 더 쉽습니까? 부트 스트랩 …

37 hypothesis-testing nonparametric bootstrap permutation-test

2

음 이항 분포 내부의 모수 이해

나는 다양한 모델로 내 데이터에 적합하고 있음을 파악하려고했다 fitdistr라이브러리 함수 MASS의이 R저를주는 Negative Binomial가장 적합한다. 이제 위키 페이지에서 정의는 다음과 같습니다. NegBin (r, p) 분포는 마지막 시험에서 성공한 k + r Bernoulli (p) 시험에서 k 실패 및 r 성공 확률을 설명합니다. R모델 피팅을 수행하는 데 사용하면 두 개의 매개 변수 …

37 r distributions modeling negative-binomial

5

교차 검증 시계열 분석

R 의 캐럿 패키지 를 사용하여 분류 및 회귀에 대한 예측 모델을 작성했습니다. Caret는 교차 검증 또는 부트 스트래핑을 통해 모델 하이퍼 파라미터를 조정할 수있는 통합 인터페이스를 제공합니다. 예를 들어 분류를 위해 간단한 '가장 가까운 이웃'모델을 구축하는 경우 몇 개의 이웃을 사용해야합니까? 2? 10? 100? Caret은 데이터를 다시 샘플링하고 다른 …

37 r time-series cross-validation

8

예측과 추론의 차이점은 무엇입니까?

나는 " 통계 학습에 대한 소개 "를 읽고 있습니다. 2 장에서는 함수 추정 대한 이유를 설명 합니다.에프ff 2.1.1 왜 추정 ?에프ff 우리가 추정 할 수있는 두 가지 이유가 있습니다 f를 : 예측 및 추론 . 우리는 차례로 차례로 토론합니다. 몇 번에 걸쳐 읽었지만 예측과 추론의 차이점에 대해서는 여전히 불분명합니다. 누군가가 …

37 prediction terminology causality

4

CNN에서 "커널"과 "필터"의 차이점

컨볼 루션 신경망의 맥락에서 용어 "커널"과 "필터"의 차이점은 무엇입니까?

37 neural-networks terminology deep-learning conv-neural-network

1

선형 혼합 효과 모델에 대해 해석하기 쉽고 적합도 측정 방법은 무엇입니까?

현재 R 패키지 lme4를 사용하고 있습니다. 임의의 효과가있는 선형 혼합 효과 모델을 사용하고 있습니다. library(lme4) mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + # random effects mod3 <- lmer(r1 …

37 r regression mixed-model random-effects-model

5

"자체를 물리 치는"예측 모델을 처리하는 방법?

저는 주요 소매점의 ML 전문가가 프레젠테이션을보고 있었는데 여기서 재고 부족 이벤트를 예측하는 모델을 개발했습니다. 시간이 지남에 따라 모델이 매우 정확 해 졌다고 가정 해 보자. 즉, 모델이 실제로 제대로 작동하면 품절 이벤트를 예상하고 피할 수 있으며 결국 품절 이벤트가 거의 또는 전혀없는 지점에 도달 할 수 있습니다. 그러나이 경우 모델을 …

36 machine-learning predictive-models

2

확률 적 경사 하강을 누가 발명 했습니까?

Gradient descent 와 Stochastic gradient descent 의 역사를 이해하려고 합니다 . 그라데이션 하강에 발명 된 코시 1847에 부어 제너럴 메도 라 해상도 데 Systèmes의 디부 방정식 simultanées . pp. 536–538 자세한 내용은 여기를 참조 하십시오 . 그 이후로 기울기 하강 법은 계속 개발되어 왔으며 나는 그들의 역사에 익숙하지 않습니다. 특히 …

36 references gradient-descent history sgd

3

왜 우리는 및 정규화 고 다른 표준은 보이지 않습니까?

나는 보통 과 규범 이 왜 정규화 되어 있는지 궁금 합니다. 왜 이것이 더 낫다는 증거가 있습니까?L1L1L_1L2L2L_2

36 lasso regularization ridge-regression

6

과학자들은 정규 분포 확률 밀도 함수의 모양을 어떻게 알아 냈습니까?

이것은 아마도 아마추어 질문 일 수도 있지만 과학자들이 정규 분포 확률 밀도 함수의 모양을 어떻게 얻었습니까? 기본적으로 버그는 누군가에게 정규 분포 데이터의 확률 함수가 종 곡선이 아닌 이등변 삼각형의 모양을 갖는 것이 더 직관적 일 것입니다. 정규 분포 데이터는 모두 종 모양입니까? 실험으로? 아니면 수학적으로 파생 된 것입니까? 결국 우리는 …

36 normal-distribution history

1

Metropolis Hastings, Gibbs, Importance 및 Rejection 샘플링의 차이점은 무엇입니까?

저는 MCMC 방법을 배우려고 노력했으며 Metropolis Hastings, Gibbs, Importance 및 Rejection 샘플링을 경험했습니다. 이러한 차이점 중 일부는 명백하지만, 즉 전체 조건이있을 때 Gibbs가 Metropolis Hastings의 특별한 사례 인 반면 Gibbs 샘플러 내에서 MH를 사용하려는 경우와 같이 다른 것은 명확하지 않습니다. 각각의 차이점을 볼 수있는 간단한 방법은 무엇입니까? 감사!

36 mcmc monte-carlo gibbs metropolis-hastings importance-sampling

4

컴퓨터 비전과 컨볼 루션 신경망에서 번역 불일치 란 무엇입니까?

컴퓨터 비전에 대한 배경 지식이 없지만 이미지 처리 및 회선 신경망 관련 기사 및 논문을 읽을 때 끊임없이 translation invariance, 또는 이라는 용어에 직면합니다 translation invariant. 또는 컨볼 루션 작업이 제공하는 많은 것을 읽었 translation invariance습니까? !! 이것은 무엇을 의미 하는가? 나는 우리가 어떤 모양으로 이미지를 바꾸더라도 이미지의 실제 개념은 …

36 machine-learning conv-neural-network convolution computer-vision

10

생존 시간이 기하 급수적으로 분포 된 것으로 추정되는 이유는 무엇입니까?

UCLA IDRE에 대한이 게시물에서 생존 분석을 배우고 있으며 섹션 1.2.1에서 넘어졌습니다. 튜토리얼은 말합니다 : ... 생존 시간이 기하 급수적으로 분포 된 것으로 알려진 경우, 생존 시간 을 관찰 할 확률은 ... 생존 시간이 기하 급수적으로 분포 된 것으로 추정되는 이유는 무엇입니까? 나에게는 매우 부자연 스럽습니다. 정규 분포가 아닌 이유는 무엇입니까? …

36 distributions survival assumptions exponential

1

중첩 교차 검증이 실제로 필요한 시점은 언제이며 실질적인 차이를 만들 수 있습니까?

교차 검증을 사용하여 모델 선택 (예 : 하이퍼 파라미터 튜닝)을 수행하고 최상의 모델의 성능을 평가하려면 중첩 교차 검증을 사용해야 합니다 . 외부 루프는 모델의 성능을 평가하는 것이고 내부 루프는 최상의 모델을 선택하는 것입니다. 모델은 각 외부 훈련 세트 (내부 CV 루프 사용)에서 선택되며 해당 성능은 해당 외부 시험 세트에서 측정됩니다. …

36 cross-validation model-selection ridge-regression

6

공분산 추정량의 분모가 왜 n-1이 아닌 n-2가 아니어야합니까?

(편향되지 않은) 분산 추정기의 분모는 이며, 관측치 가 개이고 하나의 모수 만 추정되기 때문입니다.Nn−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} 같은 토큰으로 두 개의 모수를 추정 할 때 왜 공분산의 분모가 가되지 않아야하는지 궁금합니다 .n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

36 self-study variance covariance descriptive-statistics unbiased-estimator