통계 및 빅 데이터

7

세 백분위 수만 알면 분포를 추론하는 데 사용할 수있는 방법은 무엇입니까? 예를 들어 특정 데이터 세트에서 5 번째 백분위 수는 8,135이고 50 번째 백분위 수는 11,259이며 95 번째 백분위 수는 23,611입니다. 다른 숫자에서 백분위 수로 가고 싶습니다. 그것은 내 데이터가 아니며 모든 통계입니다. 분포가 정상이 아님이 분명합니다. 내가 가진 유일한 …

23 r regression quantiles

2

부스팅은 어떻게 작동합니까?

부스팅을 이해하는 가장 쉬운 방법은 무엇입니까? 왜 매우 약한 분류기를 "무한대"(완벽하게) 향상시키지 않습니까?

23 machine-learning boosting

3

왜 베이 즈 정리에서 분모를 분해합니까?

(저는 통계 전문가입니다. 저는 수학자이자 프로그래머이며 순진한 베이지안 스팸 필터와 같은 것을 만들려고합니다.) 많은 곳에서 사람들이 베이 즈 정리의 방정식에서 분모를 분해하는 경향이 있음을 알았습니다. 그래서 이것 대신에 : P(A|B)⋅P(B)P(A)P(A|B)⋅P(B)P(A)\frac{P(A|B)\cdot P(B)}{P(A)} 우리는 이것을 제시합니다 : P(A|B)⋅P(B)P(A|B)⋅P(B)+P(A|¬B)⋅P(¬B)P(A|B)⋅P(B)P(A|B)⋅P(B)+P(A|¬B)⋅P(¬B)\frac{P(A|B)\cdot P(B)}{P(A|B)\cdot P(B)+P(A|\neg B)\cdot P(\neg B)} 이 컨벤션은 이 위키 백과 기사 와 Tim Peters의 …

23 bayesian

3

CDF가 제공된 PDF 찾기

CDF (누적 분포 함수)가 주어진 분포의 PDF (확률 밀도 함수)를 어떻게 찾을 수 있습니까?

23 distributions pdf cdf

2

탄성 순 회귀 분석에서 람다에 대해 람다가 "최소한의 표준 오차 내에서"λ를 권장하는 이유는 무엇입니까?

탄력적 그물 회귀에서 람다의 역할을 이해합니다. 교차 검증 된 오류를 최소화하는 람다의 값 인 lambda.min을 선택하는 이유를 이해할 수 있습니다. 내 질문은 통계 문헌에서 lambda.1se를 사용하는 것이 좋습니다. 즉, CV 오류와 하나의 표준 오류를 최소화하는 lambda의 값 입니까? 나는 공식적인 인용이나 심지어 이것이 종종 가치가있는 이유를 찾지 못하는 것 같습니다. …

23 regression cross-validation regularization glmnet elastic-net

4

스튜던트 t- 분포의 추정 모수

스튜던트 t- 분포의 모수에 대한 최대 우도 추정치는 무엇입니까? 닫힌 형태로 존재합니까? 빠른 Google 검색으로 결과가 나오지 않았습니다. 오늘 나는 일 변량 사례에 관심이 있지만 아마도 모델을 여러 차원으로 확장해야 할 것입니다. 편집 : 실제로 위치 및 스케일 매개 변수에 주로 관심이 있습니다. 지금은 자유도 매개 변수가 고정되어 있다고 가정하고 …

23 estimation maximum-likelihood t-distribution

6

상관 된 회귀 처리

상관 관계가 높은 회귀 분석을 사용한 다중 선형 회귀 분석에서 가장 적합한 전략은 무엇입니까? 상관 된 모든 회귀 변수를 곱하는 합법적 인 접근 방법입니까?

23 regression multicollinearity

3

평신도를위한 충분한 통계

누군가 기본적인 통계 로 충분한 통계 를 설명해 주 시겠습니까? 나는 공학적 배경에서 왔으며 많은 것을 겪었지만 직관적 인 설명을 찾지 못했습니다.

23 machine-learning mathematical-statistics intuition

4

누구나 가장 간단한 용어로 켤레 사전을 설명 할 수 있습니까?

나는 베이지안 통계에서 켤레 이전의 개념을 잠시 이해하려고 노력했지만 단순히 이해하지 못한다. 누구나 "가우스 사전"을 예로 사용하여 가장 간단한 용어로 아이디어를 설명 할 수 있습니까?

23 bayesian conditional-probability conjugate-prior

3

자기 상관의 목적은 무엇입니까?

자기 상관 이 왜 그렇게 중요한가? 나는 그것의 원리를 이해했지만 (내 생각에는 ..) 자기 상관이 발생하지 않는 예가 있기 때문에 자연스럽게 모든 것이 어떻게 자기 상관되지 않습니까? 마지막 측면은 앞서 언급했듯이 우주의 모든 국가가 이전의 국가에 의존하지 않기 때문에 자기 상관 자체에 대한 일반적인 이해를 목표로하고 있습니다.

22 autocorrelation

1

공정성을 자신있게 평가하기 위해 주사위를 몇 번 굴려야합니까?

(통계 언어가 아닌 일반 언어 사용에 대한 사전 사과.) 확실한 물리적 확신을 가지고 특정 물리적 6면 다이의 각면을 약 +/- 2 % 이내로 롤링 할 확률을 측정하려면 얼마나 많은 샘플 다이 롤이 필요합니까? 즉, 각 결과를 세어 주사위를 굴려 몇 번이나 굴려야할까요? 각면이 굴릴 확률이 14.6 %-18.7 % 이내인지 98 …

22 probability inference pdf dice

4

평균이 평균과 다른 샘플에서 더 안정적인 경향이있는 이유는 무엇입니까?

Andy Fields 등이 R 을 사용한 통계 발견의 섹션 1.7.2는 평균 대 중앙값의 장점을 나열하면서 다음과 같이 설명합니다. ... 평균은 다른 샘플에서 안정적입니다. 이것은 중간의 많은 미덕을 설명한 후에, 예를 들어 ... 중앙값은 분포의 양쪽 끝에서 극한 점수의 영향을받지 않습니다 ... 중앙값이 극단적 인 점수에 상대적으로 영향을받지 않는다는 것을 감안할 …

22 mean median

7

균일하게 분포 된 숫자의 차이가 균일하게 분포되어 있습니까?

우리는 6면 주사위를 여러 번 굴립니다. 롤과 이전 롤 간의 차이 (절대 값)를 계산하면 차이가 균일하게 분포 될 것으로 예상됩니까? 10 개의 롤로 설명하려면 : roll num result diff 1 1 0 2 2 1 3 1 1 4 3 2 5 3 0 6 5 2 7 1 4 …

22 distributions uniform

1

신경망의 비용 함수가 볼록하지 않은 이유는 무엇입니까?

여기에는 비슷한 스레드가 있습니다 ( 신경 네트워크의 비용 함수는 볼록하지 않습니까? ). 나는 거기에 대한 답변의 요점을 이해할 수 없었으며 이것을 다시 요구하는 이유는 몇 가지 문제를 분명히 할 것입니다. 제곱 차분 비용 함수의 합계를 사용하는 경우 궁극적으로 형식의 것을 최적화합니다.ΣNi=1(yi−yi^)2Σi=1N(yi−yi^)2 \Sigma_{i=1}^{N}(y_i - \hat{y_i})^2 여기서 는 훈련 중 실제 레이블 …

22 machine-learning neural-networks optimization loss-functions convex

1

ResNet 건너 뛰기 연결을 통한 그라디언트 역 전파

ResNet 모듈 / 건너 뛰기 연결을 사용하여 그라디언트가 신경망을 통해 어떻게 전파되는지 궁금합니다. ResNet에 대한 몇 가지 질문을 보았습니다 (예 : 스킵 레이어 연결을 가진 신경망 ). 이것은 훈련 중 그라디언트의 역 전파에 대해 특별히 묻습니다. 기본 아키텍처는 다음과 같습니다. 필자는이 논문 인 이미지 인식을위한 잔차 네트워크 연구 (Research of …

22 machine-learning neural-networks conv-neural-network gradient-descent backpropagation