통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

3
분산되지 않은 카운트 데이터에 적합한 모델은 무엇입니까?
분명히 분산되지 않은 R의 카운트 데이터 를 모델링하려고합니다 (분산 매개 변수 ~ .40). 이것은 glmwith family = poisson또는 negative 이항 ( glm.nb) 모형이 유의하지 않은 이유 일 수 있습니다. 내 데이터의 설명을 볼 때 일반적인 카운트 데이터 왜곡이 없으며 두 실험 조건의 잔차도 균질합니다. 그래서 내 질문은 : 카운트 데이터가 …

3
가우스 커널의 기능 맵
SVM에서 가우스 커널은 다음과 같이 정의됩니다. 여기서 x, y \ in \ mathbb {R ^ n} 입니다. \ phi 의 명시 적 방정식을 모른다 . 알고 싶습니다.x,y∈RnϕK(x,y)=exp(−∥x−y∥222σ2)=ϕ(x)Tϕ(y)K(x,y)=exp⁡(−‖x−y‖222σ2)=ϕ(x)Tϕ(y)K(x,y)=\exp\left({-\frac{\|x-y\|_2^2}{2\sigma^2}}\right)=\phi(x)^T\phi(y)x,y∈Rnx,y∈Rnx, y\in \mathbb{R^n}ϕϕ\phi 또한 ∑iciϕ(xi)=ϕ(∑icixi)∑iciϕ(xi)=ϕ(∑icixi)\sum_ic_i\phi(x_i)=\phi \left(\sum_ic_ix_i \right) 여기서 c_i \ in \ mathbb R 인지 알고 싶습니다 ci∈Rci∈Rc_i\in \mathbb R. 커널을 사용하면 선형 클래스가 …

5
변경점 분석을위한 Python 모듈
시계열에서 변경점 분석을 수행하는 Python 모듈을 찾고 있습니다. 여러 가지 알고리즘이 있으며 각 알고리즘을 수동으로 롤링하지 않고도 일부 알고리즘의 효능을 탐색하고 싶습니다. 이상적으로는 bcp (Bayesian Change Point) 또는 R의 strucchange 패키지 와 같은 일부 모듈을 원합니다. Scipy 에서 일부를 찾을 것으로 예상했지만 아무것도 만들 수 없었습니다. 다음 시설에 시설이없는 것이 …

4
다변량 정규 분포의 Quantile (isolines?)을 결정하는 방법
다변량 분포의 Quantile을 계산하는 방법에 관심이 있습니다. 그림에서, 주어진 단 변량 정규 분포 (왼쪽)의 5 %와 95 % Quantile을 그렸습니다. 올바른 다변량 정규 분포의 경우, 아날로그가 밀도 함수의베이스를 둘러싸는 아이소 라인이라고 상상합니다. 아래는 패키지를 사용하여 이것을 계산하려는 시도의 예 mvtnorm이지만 성공하지는 못했습니다. I이이 다변량 밀도 함수의 결과의 컨투어를 계산함으로써 수행 …

6
구조 방정식 모델링 소개
나는 동료들에게이 주제에 대한 도움을 요청 받았는데, 나는 정말로 모른다. 한 연구에서 일부 잠재 변수의 역할에 대한 가설을 세웠으며, 심판은 SEM에서이를 공식화하도록 요청했습니다. 그들이 필요로하는 것이 너무 어렵지 않은 것처럼, 나는 그것을 주사 할 것이라고 생각합니다 ... 지금은 주제에 대한 좋은 소개를 찾고 있습니다! 구글은 실제로 내 친구가 아니었다. 미리 …

3
R을 사용한 반복 측정으로 ANOVA 후 사후 테스트
다음과 같이 R에서 반복 측정 ANOVA를 수행했습니다. aov_velocity = aov(Velocity ~ Material + Error(Subject/(Material)), data=scrd) summary(aov_velocity) 측정 값이 반복되는 분산 분석 후 사후 테스트를 수행하기 위해 R의 어떤 구문을 사용할 수 있습니까? Bonferroni 보정을 사용한 Tukey의 테스트가 적절합니까? 그렇다면 R에서 어떻게 할 수 있습니까?

2
평신도의 관점에서 Parzen 창 (커널) 밀도 추정을 설명 할 수 있습니까?
Parzen 창 밀도 추정은 다음과 같이 설명됩니다 p ( x ) = 1엔∑나는 = 1엔1h2ϕ ( x나는− xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) 여기서, 벡터의 요소 수이고, 벡터이며, 의 확률 밀도 , 파젠 윈도우의 사이즈이고, 윈도우 함수이다.x p ( x ) x h ϕ엔nn엑스xxp ( x )p(x)p(x)엑스xxhhhϕϕ\phi 내 …

3
'별칭 계수'란 무엇입니까?
R ( lm) 로 회귀 모델을 작성하는 동안 이 메시지가 자주 나타납니다. "there are aliased coefficients in the model" 정확히 무엇을 의미합니까? 또한 이로 인해 predict()경고가 표시됩니다. 경고 일 뿐이지 만 모델을 만들기 전에 앨리어싱 된 계수를 어떻게 감지 / 제거 할 수 있는지 알고 싶습니다. 또한이 경고를 무시한 결과는 …
24 r  regression 


1
F1 / 주사위 점수 vs IoU
F1 점수, 주사위 점수 및 IoU (노조에 대한 교차점)의 차이에 대해 혼란 스러웠습니다. 지금까지 나는 F1과 Dice가 같은 것을 의미한다는 것을 알았고 (오른쪽?) IoU는 다른 두 가지와 매우 유사한 공식을 가지고 있습니다. F1 / 주사위 : 2TP2TP+FP+FN2TP2TP+FP+FN\frac{2TP}{2TP+FP+FN} IoU / 자카드 : TPTP+FP+FNTPTP+FP+FN\frac{TP}{TP+FP+FN} F1이 실제 양성에 가중치를 부여한다는 점을 제외하고는 실질적인 …

2
드롭 아웃과 드롭 연결의 차이점은 무엇입니까?
드롭 아웃과 드롭 연결의 차이점은 무엇입니까? AFAIK, 드롭 아웃은 훈련 중에 숨겨진 노드를 임의로 삭제하지만 테스트 중에는 유지하고 드롭 연결 드롭 연결을 유지합니다. 그러나 연결을 삭제하는 것이 숨겨진 노드를 삭제하는 것과 같지 않습니까? 노드 (또는 연결)가 가중치 집합이 아닙니까?

2
필터 매트릭스의 요소를 초기화하는 방법은 무엇입니까?
라이브러리 (Convnet 또는 TensorFlow와 같은)에 의존하지 않는 Python 코드를 작성하여 회선 신경 네트워크를 더 잘 이해하려고 노력하고 있으며 커널 매트릭스의 값을 선택하는 방법에 대한 문헌에 갇혀 있습니다. 이미지에서 컨볼 루션을 수행합니다. 아래 그림의 CNN 계층을 보여주는 기능 맵 사이의 단계에서 구현 세부 사항을 이해하려고합니다 . 이 다이어그램에 따르면 : 커널 …

3
1과 100 사이의 25 개의 난수에서 가장 높은 확률이 두 번 이상 나타날 확률은 얼마입니까?
많은 온라인 게임에서 플레이어가 어려운 작업을 완료하면 때로는 작업을 완료 한 모든 사람이 사용할 수있는 특별 보상이 제공됩니다. 일반적으로 마운트 (교통 수단) 또는 다른 허영 아이템 (캐릭터의 성능을 향상시키지 않고 주로 외관 사용자 지정에 사용되는 항목)입니다. 그러한 보상이 주어지면 보상을받는 사람을 결정하는 가장 일반적인 방법은 난수를 이용하는 것입니다. 게임에는 일반적으로 …



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.