통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


1
분위수 회귀 : 표준 오류는 무엇입니까?
quantreg 비네팅 의 summary.rq기능 은 Quantile 회귀 계수의 표준 오차 추정에 대한 다양한 선택을 제공합니다. 이들 각각이 최적 / 바람직하게되는 특별한 시나리오는 무엇입니까? Koenker (1994)에 설명 된대로 순위 테스트를 반전하여 추정 된 매개 변수에 대한 신뢰 구간을 생성하는 "순위". 기본 옵션은 오류가 iid 인 것으로 가정하고 iid = FALSE 옵션은 …

2
R의 lm에서 조정 된 R- 제곱 공식은 무엇이며 어떻게 해석해야합니까?
조정 된 R- 제곱에 대해 R에서 사용되는 정확한 공식은 무엇입니까 lm() ? 어떻게 해석 할 수 있습니까? 조정 된 R- 제곱 공식 조정 된 R- 제곱을 계산하는 공식이 여러 개있는 것 같습니다. 나룻배의 식 : 1−(1−R2)(n−1)(n−v)1−(1−R2)(n−1)(n−v)1-(1-R^2)\frac{(n-1)}{(n-v)} McNemar의 식 : 1−(1−R2)(n−1)(n−v−1)1−(1−R2)(n−1)(n−v−1)1-(1-R^2)\frac{(n-1)}{(n-v-1)} 주님의 공식 : 1−(1−R2)(n+v−1)(n−v−1)1−(1−R2)(n+v−1)(n−v−1)1-(1-R^2)\frac{(n+v-1)}{(n-v-1)} 스타 인의 공식 : 1−[(n−1)(n−k−1)(n−2)(n−k−2)(n+1)n](1−R2)1−[(n−1)(n−k−1)(n−2)(n−k−2)(n+1)n](1−R2)1-\big[\frac{(n-1)}{(n-k-1)}\frac{(n-2)}{(n-k-2)}\frac{(n+1)}{n}\big](1-R^2) 교과서 …

3
임의 포리스트에 대한 OOB 및 혼동 행렬을 해석하는 방법은 무엇입니까?
임의의 포리스트 모델을 실행하기 위해 누군가로부터 R 스크립트를 받았습니다. 직원 데이터로 수정하고 실행했습니다. 우리는 자발적인 분리를 예측하려고합니다. 다음은 몇 가지 추가 정보입니다. 분류 모델은 0 = 직원 유지, 1 = 직원 종료, 현재 12 개의 예측 변수 만보고 있습니다. 데이터의 용어는 "불균형"입니다. 총 레코드 세트의 % 다양한 mtry 및 ntree …

7
다중 선형 회귀 모형에 포함 할 변수 선택
현재 다중 선형 회귀를 사용하여 모델을 작성하려고합니다. 내 모델을 둘러 본 후에는 유지할 변수와 제거 할 변수를 가장 잘 결정하는 방법을 모르겠습니다. 내 모델은 DV에 대한 10 개의 예측 변수로 시작했습니다. 10 개의 예측 변수를 모두 사용할 때 4 개가 유의 한 것으로 간주되었습니다. 명백히 틀린 예측 변수 중 일부만 …

3
다변량 정규 밀도의 미분을 얻는 방법?
다변량 정규 밀도 가 있다고 가정 합니다. 두 번째 (부분) 미분 wrt 을 얻고 싶습니다 . 행렬의 미분을 취하는 방법을 모릅니다.N(μ,Σ)N(μ,Σ)N(\mu, \Sigma)μμ\mu Wiki는 행렬 내부의 미분 요소를 요소별로 가져옵니다. Laplace 근사치 모드는 입니다.logPN(θ)=logPN−12(θ−θ^)TΣ−1(θ−θ^).log⁡PN(θ)=log⁡PN−12(θ−θ^)TΣ−1(θ−θ^).\log{P}_{N}(\theta)=\log {P}_{N}-\frac{1}{2}{(\theta-\hat{\theta})}^{T}{\Sigma}^{-1}(\theta-\hat{\theta}) \>.θ^=μθ^=μ\hat\theta=\mu 나는 어떻게 이런 일이 일어 났습니까?Σ−1=−∂2∂θ2logp(θ^|y),Σ−1=−∂2∂θ2log⁡p(θ^|y),{\Sigma}^{-1}=-\frac{{{\partial }^{2}}}{\partial {{\theta }^{2}}}\log p(\hat{\theta }|y), 내가 한 일 : …

2
평범한 영어로 복합 대칭이란 무엇입니까?
I는 최근에 실현 화합물 대칭의 혼합 모델의 상호 연관 구조를 설정할 때 임의의 요소와 고정 요소와 다른 요소로만 피사체 혼합 모델은 ANOVA에 해당된다. 그러므로 나는 혼합 된 (즉, split-plot) 분산 분석의 맥락에서 복합 대칭이 무엇을 의미하는지 알고 싶습니다. 복합 대칭 외에도 lme다음과 같은 다른 유형의 상관 구조를 제공합니다. corSymm 추가 …

4
단측 가설 검정의 정당화
양측 가설 검정을 이해합니다. 당신은이 (대 H 1 = ¬ H 0 : θ ≠ θ 0 ). 피의 -value 그 확률 θ가 관찰 것과 극도로 적어도 데이터를 생성한다.H0: θ = θ0H0:θ=θ0H_0 : \theta = \theta_0H1= ¬ H0: θ ≠ θ0H1=¬H0:θ≠θ0H_1 = \neg H_0 : \theta \ne \theta_0피ppθθ\theta 단측 가설 …

5
상호 작용 효과를 식별하는 모범 사례는 무엇입니까?
모델 ( x1:x2또는 x1*x2 ... xn-1 * xn) 에서 변수의 가능한 각 조합을 문자 그대로 테스트하는 것 외에 . 독립적 (희망) 변수 사이에 교호 작용이 있어야하는지 또는 어떻게해야하는지 어떻게 식별합니까? 상호 작용을 식별하려는 모범 사례는 무엇입니까? 사용할 수 있거나 사용할 수있는 그래픽 기술이 있습니까?

5
R에서 '주석'기능을 잘 사용하는 것은 무엇입니까?
방금 commentR 에서 함수를 발견 했습니다. 예 : x <- matrix(1:12, 3,4) comment(x) <- c("This is my very important data from experiment #0234", "Jun 5, 1998") x comment(x) 이 기능을 처음 사용했을 때이 기능이 일반적이고 유용한 용도가 무엇인지 궁금했습니다. Google에서 "R 댓글"을 검색하고 관련 결과를 찾기가 매우 어려우므로 여기 누군가가 …
35 r 


3
기계 학습 : 이진 예측에 범주 형 크로스 엔트로피 또는 이진 크로스 엔트로피 손실을 사용해야합니까?
우선, 이진 예측을 수행해야하는 경우 원 핫 인코딩을 수행하여 두 개 이상의 클래스를 만들어야한다는 것을 깨달았습니다. 이 올바른지? 그러나 클래스가 하나 뿐인 예측에 대해서만 이진 교차 엔트로피입니까? TensorFlow와 같은 대부분의 라이브러리에서 일반적으로 발견되는 범주 형 크로스 엔트로피 손실을 사용한다면 큰 차이가 있습니까? 실제로 범주와 이진 교차 엔트로피의 정확한 차이점은 무엇입니까? …

2
인공 지구 온난화에 대한 증거는 '골드 표준'을 명중합니다. 그들은 어떻게 했습니까?
2019 년 2 월 25 일에 나온 로이터 기사 의이 메시지 는 현재 뉴스 전체에 있습니다. 인공 지구 온난화에 대한 증거는 '골드 표준'을 명중 [과학자] 지구의 표면에서 인간의 활동이 열을 높이고 있다는 확신은“5 시그마”수준에 도달했다는 통계적 지표는 백만 분의 1의 확률 만있을 경우 신호가 나타날 수 있음을 의미합니다 온난화가 없습니다. …

3
드롭 아웃 레이어 전후에 풀링 레이어가 추가됩니까?
Convolutional Neural Network (CNN)를 만들고 있는데, 여기에는 Convolutional 레이어와 풀링 레이어가 있으며 드롭 아웃을 적용하여 과적 합을 줄이려고합니다. 풀링 레이어 뒤에 드롭 아웃 레이어를 적용해야한다는 느낌이 들지만 실제로 백업 할 항목이 없습니다. 드롭 아웃 레이어를 추가하기에 적합한 장소는 어디입니까? 풀링 레이어 전후에?

5
표본 크기를 늘리면 (샘플링) 분산이 낮아지는 이유는 무엇입니까?
큰 그림: 샘플 크기를 늘리면 실험의 힘이 어떻게 증가하는지 이해하려고합니다. 강사의 슬라이드는 두 가지 정규 분포, 하나는 귀무 가설에 대한 것과 다른 하나는 대립 가설에 대한 것, 그리고 그 사이의 결정 임계 값 c를 사용하여 설명합니다. 그들은 표본 크기가 증가하면 분산이 낮아지고 첨도가 높아져 곡선 아래의 공유 영역이 줄어들어 유형 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.