통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

1
경험적 베이는 어떻게 유효합니까?
그래서 나는 훌륭한 책인 Empirical Bayes를 읽었습니다 . 나는 그 책이 훌륭하다고 생각했지만, 데이터로부터 사전 구축은 잘못되었다고 느꼈다. 분석 계획을 세우고 데이터를 수집 한 다음 분석 계획에서 이전에 결정한 가설을 테스트하도록 훈련했습니다. 이미 수집 한 데이터에 대한 분석을 수행 할 때 "유의 한"항목에 ​​대해 훨씬 더 엄격해야하는 선택 후 추론을 …

2
음 이항 분포의 연속 일반화
음 이항 (NB) 분포 는 음이 아닌 정수로 정의되며 확률 질량 함수 k \ in \ mathbb N_0 을 x \ in \ mathbb R _ {\ ge 0}로f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)=(k+r−1k)pk(1−p)r.f(k;r,p)={\binom {k+r-1}{k}}p^{k}(1-p)^{r}. 바꾸는 음이 아닌 실수에 대한 연속 분포를 고려하는 것이 합리적 입니까? 이항 계수는 (k + 1) \ cdot \ ldots …

2
분위수 회귀 : 손실 함수
나는 Quantile 회귀를 이해하려고 노력하고 있지만, 고통받는 한 가지는 손실 함수의 선택입니다. ρτ(u)=u(τ−1{u&lt;0})ρτ(u)=u(τ−1{u&lt;0})\rho_\tau(u) = u(\tau-1_{\{u<0\}}) 나는 의 최소 ​​기대치가 τ % -quantile 과 같다는 것을 알고 있지만,이 기능으로 시작하는 직관적 인 이유는 무엇입니까? 이 기능을 최소화하는 것과 Quantile의 관계는 보이지 않습니다. 누군가 나에게 설명 할 수 있습니까?ρτ(y−u)ρτ(y−u)\rho_\tau(y-u)τ%τ%\tau\%


2
혼합 모형이 예측 모형으로 유용합니까?
나는 예측 모델링과 관련하여 혼합 모델의 장점에 대해 약간 혼란 스럽습니다. 예측 모델은 일반적으로 이전에 알려지지 않은 관측치의 값을 예측하기위한 것이기 때문에 혼합 모델이 유용 할 수있는 유일한 방법은 모집단 수준 예측 (임의의 효과를 추가하지 않음)을 제공하는 기능을 통해서만 가능하다는 것입니다. 그러나 문제는 지금까지 혼합 모형을 기반으로 한 인구 수준 …

3
Adam Optimizer가 하이퍼 매개 변수의 값에 대해 강력한 것으로 간주되는 이유는 무엇입니까?
저는 Deep Learning 의 Adam 최적화 프로그램에 대해 읽었으며 Bengio, Goodfellow 및 Courville 의 새 책 Deep Learning 에서 다음 문장 을 보았습니다. Adam은 일반적으로 학습 매개 변수를 제안 된 기본값에서 변경해야하지만 하이퍼 매개 변수를 선택하는 데 상당히 강력한 것으로 간주됩니다. 이것이 사실이라면 하이퍼 파라미터 검색은 딥 러닝 시스템의 통계 …

2
누가 의사 결정 트리를 발명 했습니까?
의사 결정 트리 데이터 구조와 알고리즘을 누가 발명했는지 추적하려고합니다. 의사 결정 트리 학습 에 관한 Wikipedia 항목 에는 "ID3과 CART가 거의 동시에 (1970 년에서 1980 년 사이) 독립적으로 발명되었다"는 주장이 있습니다. ID3은 나중에 다음과 같이 제시되었습니다. Quinlan, JR 1986. 의사 결정 나무의 유도. 마하 배우다. 1, 1 (1986 년 3 …
24 cart  history 

3
정보가없는 이전 이론의 역사
유익하지 않은 선행에 대한 베이지안 통계 과정 (경제학 석사)에 대한 짧은 이론 에세이를 작성하고 있으며이 이론의 발전 단계를 이해하려고합니다. 지금까지, 타임 라인은 Laplace의 무차별 원칙 (1812), 비 변치 이전 (Jeffreys (1946)), Bernardo 이전 (1979)의 세 가지 주요 단계로 이루어졌습니다. 저의 문헌 검토에서, 무차별 원칙 (Laplace)은 이전 정보의 부족을 나타내는 데 …

2
iid 데이터의 역설 (적어도 나를 위해)
통계에 대한 나의 총체적인 (그리고 부족한) 지식이 허용되는 한, 이 iid 랜덤 변수 , 용어가 암시하는 것처럼 그것들은 독립적이고 동일하게 분포된다는 것을 이해했습니다.X1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_n 내 관심사는 iid 샘플의 이전 속성입니다. p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(X_{n}|X_{i_1},X_{i_2},...,X_{i_k}) = p(X_{n}), 별개의 's st .ijiji_j1≤ij&lt;n1≤ij&lt;n1 \leq i_j < n 그러나 동일한 분포의 독립적 인 표본의 집합이 분포 …

7
비 기술적이지만 심층적 인 기사에 대한 권장 사항
이 질문에 대한 영감은 Leo-Breiman의 유명한 기사 Statistical Modeling : The Two Cultures (사용 가능한 공개 액세스) 에서 비롯됩니다 . 저자는 자신이보고있는 것을 데이터 분석에 대한 두 가지 다른 접근 방식으로 비교하고 고전 통계 및 기계 학습의 핵심 아이디어를 만집니다. 그러나이 기사는 의사 수준에서 통계를 추구했는지 또는 입문 과정을 밟았는지 …
24 references 

1
MCMC 표본의 한계 우도 계산
이것은 되풀이되는 질문이지만 ( 이 게시물 , 이 게시물 및 이 게시물 참조 ) 다른 스핀이 있습니다. 일반 MCMC 샘플러의 많은 샘플이 있다고 가정합니다. 각 표본 대해 θθ\theta, 로그 우도 logf(x|θ)log⁡f(x|θ)\log f(\textbf{x} | \theta) 와 로그 우선 의 값을 알고 logf(θ)log⁡f(θ)\log f(\theta)있습니다. 도움이된다면 데이터 포인트 당 로그 우도 값 도 …

3
Hosmer-Lemeshow 적합도의 로지스틱 회귀 및 해석 평가
우리 모두 알고 있듯이 로지스틱 회귀 모델을 평가하는 두 가지 방법이 있으며 매우 다른 것들을 테스트하고 있습니다. 예측력 : 독립 변수를 기반으로 종속 변수를 얼마나 잘 예측할 수 있는지 측정하는 통계량을 얻으십시오. 잘 알려진 Pseudo R ^ 2는 McFadden (1974)과 Cox and Snell (1989)입니다. 적합도 통계 이 테스트는 모델을 더 …

3
산술 평균이 기하 평균에 매우 가까운 경우 데이터에 대해 무엇을 결론 낼 수 있습니까?
~ 0.1 %와 같이 서로 매우 근접한 기하 평균과 산술 평균에 대해 중요한 것이 있습니까? 그러한 데이터 세트에 대해 어떤 추측을 할 수 있습니까? 나는 데이터 세트를 분석하려고 노력했으며, 아이러니하게도 값이 매우 가깝다는 것을 알았습니다. 정확하지는 않지만 가깝습니다. 또한 산술 평균 기하학 평균 불평등의 빠른 온 전성 검사와 데이터 수집 …

2
텍스트 분류를위한 용어집 : 왜 TFIDF 대신 단어 빈도를 사용하지 않습니까?
텍스트 분류에 대한 일반적인 접근 방식은 분류기를 '단어 모음'에서 학습시키는 것입니다. 사용자는 텍스트를 분류하고 각 객체의 단어 빈도를 세고 그에 따라 트리밍 가능한 크기의 행렬을 유지하기위한 일종의 트리밍을 계산합니다. 종종 사용자는 TFIDF를 사용하여 기능 벡터를 구성하는 것을 봅니다. 다시 말해, 위에서 언급 한 텍스트 빈도는 말뭉치의 단어 빈도에 의해 가중됩니다. …

4
분산 분석 대 다중 선형 회귀 분석? ANOVA가 실험 연구에서 왜 그렇게 일반적으로 사용됩니까?
분산 분석 대 다중 선형 회귀 분석? 이 두 가지 방법 모두 동일한 통계 모델을 사용하는 것 같습니다. 그러나 어떤 상황에서 어떤 방법을 사용해야합니까? 비교할 때 이러한 방법의 장단점은 무엇입니까? 왜 ANOVA가 실험 연구에서 일반적으로 사용되며 회귀 연구를 거의 찾지 못하는가?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.