통계 및 빅 데이터

4

나는 가변 자동 인코더와 일반 (결정적) 자동 인코더의 기본 구조와 그 뒤에있는 수학을 이해하지만 언제 어떤 유형의 자동 인코더를 다른 유형보다 선호합니까? 내가 생각할 수있는 것은 가변 오토 인코더의 잠복 변수의 사전 분포가 잠복 변수를 샘플링 한 다음 새로운 이미지를 구성 할 수 있다는 것입니다. 결정적 오토 인코더에 비해 가변 …

19 deep-learning autoencoders variational-bayes

1

로지스틱 회귀 최적화에 Newton의 방법을 사용하는 것을 반복 재가 중 최소 제곱이라고하는 이유는 무엇입니까?

로지스틱 회귀 최적화에 Newton의 방법을 사용하는 것을 반복 재가 중 최소 제곱이라고하는 이유는 무엇입니까? 물류 손실과 최소 제곱 손실이 완전히 다르기 때문에 나에게 분명하지 않은 것 같습니다.

19 logistic generalized-linear-model optimization irls fisher-scoring

2

사후 분포를 이미 알고 있다면 왜 사후 분포에서 표본을 추출해야합니까?

내 이해는 베이지안 접근법을 사용하여 매개 변수 값을 추정 할 때입니다. 사후 분포는 사전 분포와 우도 분포의 조합입니다. 우리는 사후 분포에서 표본을 생성하여이를 시뮬레이션합니다 (예를 들어, Metropolis-Hasting 알고리즘을 사용하여 값을 생성하고 사후 분포에 속할 확률의 특정 임계 값보다 높은 경우 값을 수용 함). 이 샘플을 생성 한 후에는이 샘플을 사용하여 …

19 bayesian inference simulation mcmc posterior

6

컨볼 루션 레이어 : 패딩 또는 패딩?

AlexNet 아키텍처는 그림과 같이 제로 패딩을 사용합니다. 그러나이 패딩이 도입 된 이유는 논문에 설명되어 있지 않습니다. Standford CS 231n 과정에서는 공간 크기를 보존하기 위해 패딩을 사용합니다. 이것이 패딩이 필요한 유일한 이유인지 궁금합니다. 공간 크기를 유지할 필요가 없다면 패딩을 제거 할 수 있습니까? 더 깊이 들어가면 공간 크기가 매우 빠르게 줄어 …

19 conv-neural-network convolution

4

범주 형 데이터를 사용하면 변수가 관련되지 않은 군집이있을 수 있습니까?

군집 분석을 설명하려고 할 때 사람들이 변수가 상관되어 있는지 여부와 관련된 것으로 프로세스를 오해하는 것이 일반적입니다. 사람들이 혼란을 극복 할 수있는 한 가지 방법은 다음과 같은 도표입니다. 이것은 군집이 있는지의 여부와 변수가 관련되어 있는지의 여부의 차이를 명확하게 표시합니다. 그러나 이는 연속 데이터의 차이점 만 보여줍니다. 범주 형 데이터가있는 아날로그를 생각하는 …

19 clustering categorical-data independence

4

계층 적 클러스터링의 단점을 이해하는 방법?

누군가 계층 적 클러스터링의 장단점을 설명 할 수 있습니까? 계층 적 군집화에는 K와 같은 단점이 있습니까? K 평균에 비해 계층 적 클러스터링의 장점은 무엇입니까? 우리는 언제 계층 적 클러스터링보다 K 수단을 사용해야합니까? 이 게시물에 대한 답변은 k의 단점을 잘 설명합니다. K- 평균의 단점을 이해하는 방법

19 clustering k-means unsupervised-learning hierarchical-clustering

2

왜도 및 제로 초과 첨도를 가진 비정규 분포?

대부분 이론적 인 질문입니다. 처음 네 모멘트 가 정규 분포와 같은 비정규 분포의 예가 있습니까? 그것들은 이론적으로 존재할 수 있습니까?

19 normal-distribution skewness moments theory kurtosis

2

스튜던트 t 테스트는 Wald 테스트입니까?

스튜던트 t 테스트는 Wald 테스트입니까? Wasserman의 All of Statistics 에서 Wald 테스트에 대한 설명을 읽었습니다 . Wald 테스트에는 t- 테스트가 포함되어있는 것 같습니다. 그 맞습니까? 그렇지 않다면 t- 테스트가 Wald 테스트가 아닌 이유는 무엇입니까?

19 hypothesis-testing t-test

3

k- 평균 클러스터 파티션에서 가장 중요한 기능 추정

k- 평균 군집 솔루션에서 데이터 세트의 어떤 기능 / 변수가 가장 중요 / 주요한지를 결정하는 방법이 있습니까?

19 machine-learning clustering k-means importance

1

사후 또는 계획된 비교 테스트로 바로 넘어 가지 않고 ANOVA를 사용하는 이유는 무엇입니까?

그룹 간 분산 분석 상황을 살펴보면 실제로 이러한 분산 분석 테스트를 먼저 수행하고 두 번째로 사후 분석 (Bonferroni, Šidák 등) 또는 계획된 비교 테스트를 수행하면 무엇을 얻을 수 있습니까? 분산 분석 단계를 완전히 건너 뛰지 않겠습니까? 이러한 상황에서 그룹 간 분산 분석의 이점 중 하나는 Tukey의 HSD를 사후 테스트로 사용할 …

19 hypothesis-testing anova multiple-comparisons post-hoc

2

시계열에서 뒤집을 수없는 과정의 직관은 무엇입니까?

시계열에 관한 책을 읽고 있는데 다음 부분에서 머리를 긁기 시작했습니다. 누군가 나를 위해 직감을 설명 할 수 있습니까? 나는이 본문에서 그것을 얻을 수 없었다. 왜 우리는 프로세스를 뒤집을 수 있어야합니까? 여기 큰 그림은 무엇입니까? 도움을 주셔서 감사합니다. 나는이 물건을 처음 사용하므로 이것을 설명 할 때 학생 수준의 용어를 사용할 수 …

19 time-series arma

1

2D 히스토그램에 대한 적합도

별 매개 변수를 나타내는 두 가지 데이터 세트가 있습니다 : 관찰 된 것과 모델링 된 것. 이 세트를 사용하여 2 색 다이어그램 (TCD)을 만듭니다. 샘플은 여기에서 볼 수 있습니다. A 는 관찰 된 데이터이고 B 는 모델에서 추출 된 데이터입니다 (검은 선을 염두에 두지 말고 점은 데이터를 나타냅니다) 나는 하나의 …

19 goodness-of-fit histogram

2

시계열에 대한 가설 검정 및 의의

두 모집단을 볼 때 일반적인 유의성 검정은 가능하면 t- 검정, 쌍 t- 검정입니다. 이것은 분포가 정상이라고 가정합니다. 시계열에 대한 유의성 검정을 생성하는 유사한 단순화 가정이 있습니까? 구체적으로 우리는 다르게 처리되고있는 상당히 적은 양의 생쥐를 가지고 있으며, 일주일에 한 번 체중을 측정하고 있습니다. 두 그래프 모두 그래프가 매끄럽게 증가하면서 부드럽게 증가하는 …

19 time-series hypothesis-testing statistical-significance

2

역 전파 알고리즘

다층 퍼셉트론 (MLP)에 사용 된 역 전파 알고리즘 에 약간의 혼동이 있었습니다. 비용 함수에 의해 오류가 조정됩니다. 역 전파에서 숨겨진 레이어의 가중치를 조정하려고합니다. 이해할 수있는 출력 오류, 즉 e = d - y[첨자없이]입니다. 질문은 : 숨겨진 레이어의 오류는 어떻게 얻습니까? 어떻게 계산합니까? 역 전파하는 경우 적응 필터의 비용 함수로 사용해야합니까, …

19 machine-learning neural-networks backpropagation

3

0-1 손실 기능 설명

손실 함수의 목적이 무엇인지 파악하려고 노력하고 있으며 이해할 수 없습니다. 따라서 손실 함수를 이해하는 한, 잘못된 결정의 "비용"을 측정 할 수있는 일종의 메트릭을 도입하는 것입니다. 30 개 개체의 데이터 세트를 가지고 있고이를 20/10과 같은 훈련 / 테스트 세트로 나누었다 고 가정하겠습니다. 0-1 손실 함수를 사용할 것이므로 클래스 레이블 세트가 M …

19 machine-learning loss-functions