통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

1
부트 스트랩을 사용하여 회귀 계수의 신뢰 구간을 추정하는 두 가지 방법
데이터에 선형 모델을 적용하고 있습니다 : 와이나는= β0+ β1엑스나는+ ϵ나는,ϵ나는~ N( 0 , σ2) .와이나는=β0+β1엑스나는+ϵ나는,ϵ나는∼엔(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). 부트 스트랩 방법을 사용하여 계수 ( , ) 의 신뢰 구간 (CI)을 추정하고 싶습니다 . 부트 스트랩 방법을 적용 할 수있는 두 가지 방법이 있습니다. β 1β0β0\beta_{0}β1β1\beta_{1} 표본 대응 반응 예측 …

1
어떤 기능이 커널 일 수 있습니까?
기계 학습 및 패턴 인식과 관련하여 Kernel Trick 이라는 개념이 있습니다. 함수가 커널 함수일 수 있는지 여부를 묻는 문제가 발생하면 정확히 어떻게해야합니까? 다항식, RBF 및 가우시안과 같은 3 개 또는 4 개의 커널 함수 형태인지 먼저 확인해야합니까? 그럼 어떻게해야합니까? 그것이 양의 명확한 지 보여 주어야합니까? 누군가가 그러한 문제에 대한 단계별 …

3
glm (R)에서 적합도를 계산하는 방법
이 질문은 교차 검증에서 답변 될 수 있기 때문에 스택 오버플 로 에서 마이그레이션 되었습니다. 6 년 전에 이주했습니다 . glm 기능을 실행하면 다음과 같은 결과가 나타납니다. 다음 값을 어떻게 해석 할 수 있습니까? 널 이탈 잔여 이탈 AIC 그들은 적합 함과 관련이 있습니까? 이 결과에서 R-square 또는 다른 측정 …

2
LDA 하이퍼 파라미터에 대한 자연 해석
누군가 LDA 하이퍼 파라미터에 대한 자연 해석이 무엇인지 설명 할 수 있습니까? ALPHA그리고 BETA(문서 당) 주제 및 (주제 당) 단어 분포에 대한 디리클레 분포의 매개 변수입니다. 그러나 누군가이 하이퍼 매개 변수의 값을 더 작게 선택하는 것이 무엇을 의미하는지 설명 할 수 있습니까? 그것은 문서의 주제 희소성 및 주제의 상호 배타성에 …


1
R에서 GBM의 n.minobsinnode 매개 변수의 역할 [닫힘]
이 질문은 향후 방문자를 도울 것 같지 않습니다. 그것은 작은 지리적 영역, 특정 시점, 또는 인터넷의 전세계 관객에게 일반적으로 적용되지 않는 매우 좁은 상황에만 관련됩니다. 이 질문을보다 광범위하게 적용 할 수 있도록 도움말 센터를 방문하십시오 . 휴일 칠년 전에 . GBM 패키지에서 n.minobsinnode 매개 변수의 의미 를 알고 싶었습니다 . …
21 r  gbm 

3
상호 작용 효과가 중요하지 않은 경우 주요 효과를 해석하는 방법은 무엇입니까?
R에서 Generalized Linear Mixed Model을 실행하고 두 예측 변수 간의 상호 작용 효과를 포함 시켰습니다. 교호 작용은 유의하지 않았지만 주 효과 (두 예측 변수)는 둘 다였습니다. 이제 많은 교과서 예에서 상호 작용에 중요한 영향이 있으면 주된 효과를 해석 할 수 없다고 말합니다. 그러나 상호 작용이 중요하지 않은 경우 어떻게해야합니까? 두 …

4
FPCA (Functional Principal Component Analysis) : 모든 것이 무엇입니까?
FPCA (Functional Principal Component Analysis)는 내가 우연히 발견했지만 이해하지 못한 것입니다. 무엇에 관한 것입니까? 2011 년 Shang의 "기능적 주요 구성 요소 분석 조사"를 참조하십시오 . PCA는“차원의 저주”(Bellman 1961)로 인해 기능 데이터를 분석하는 데 심각한 어려움을 겪습니다. "차원의 저주"는 고차원 공간의 데이터 희소성에서 비롯됩니다. PCA의 기하학적 특성이 유효하고 수치 기법이 안정적인 …


3
랜덤 변수가 함수로 정의 된 이유는 무엇입니까?
임의 변수의 개념을 함수로 이해하는 데 문제가 있습니다. 나는 역학을 이해하지만 (나는 생각한다) 동기를 이해하지 못한다 ... 말 트리플 확률, 어디 , Borel-이다 그 간격 -algebra 및 정규 베그 측정 값이다. 하자 행 랜덤 변수 일 에 되도록 , , ..., 이므로 는 1에서 6까지의 값에 대해 불연속 분포를 갖습니다. …

2
분산 이전 의 왜 약한 것으로 간주됩니까?
배경 분산에서 가장 일반적으로 사용되는 약점 중 하나는 매개 변수가 역 감마입니다 (Gelman 2006) .α = 0.001 , β= 0.001α=0.001,β=0.001\alpha =0.001, \beta=0.001 그러나이 분포의 90 % CI는 약 입니다.[ 3 × 1019, ∞ ][삼×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf 이로부터 는 분산이 매우 높을 확률이 …

3
교육 손실은 시간이 지남에 따라 증가합니다 [중복]
이 질문에는 이미 답변이 있습니다 . 비용 함수의 변화는 어떻게 긍정적일 수 있습니까? (1 답변) 신경망이 학습하지 않으면 어떻게해야합니까? (5 답변) 지난달 휴무 . 4 가지 유형의 시퀀스를 분류하기 위해 모델 (Recurrent Neural Network)을 훈련하고 있습니다. 훈련을 진행할 때 훈련 배치에서 샘플의 90 % 이상을 올바르게 분류 할 때까지 훈련 …

2
numpy 및 sklearn의 PCA는 다른 결과를 생성합니다
내가 뭔가를 오해하고 있습니까? 이것은 내 코드입니다 sklearn을 사용하여 import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], [1,12756,5.52], [1.524,6787,3.94], ]) pca.fit_transform(x) 산출: array([[ -4.25324997e+03, -8.41288672e-01, …

2
병목 현상 아키텍처는 신경망에서 어떻게 작동합니까?
[2 개의 3x3 전환 레이어]가 [하나의 1x1 전환, 하나의 3x3 전환 및 다른 1x1 전환 레이어]로 대체되는 ResNet 논문에서 발견되는 유형으로 병목 현상 아키텍처를 정의합니다 . 1x1 전환 레이어는 치수 축소 (및 복원)의 형태로 사용되며 다른 게시물 에서 설명 합니다. 그러나 왜이 구조가 원래 레이아웃만큼 효과적인지 확실하지 않습니다. 몇 가지 …

1
히든 마르코프 모델과 입자 필터 (및 칼만 필터)의 차이점
여기 내 오래된 질문이 있습니다 HMM (Hidden Markov) 모델과 PF (Particle Filter)의 차이를 알고 누군가 Kalman Filter 또는 어떤 상황에서 어떤 알고리즘을 사용하는지 알고 싶습니다. 저는 학생이며 프로젝트를해야하지만 먼저 몇 가지를 이해해야합니다. 따라서 참고 문헌에 따르면 둘 다 숨겨진 (또는 잠복 또는 관찰되지 않은) 상태를 포함한 상태 공간 모델 입니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.