통계 및 빅 데이터

4

다중 회귀 방정식에 입력 할 수있는 독립 변수의 수에는 제한이 있습니까? 결과 변수에 대한 상대적 기여도 측면에서 조사하고자하는 예측 변수가 10 개 있습니다. 여러 분석을 조정하기 위해 bonferroni 수정을 사용해야합니까?

19 regression predictor importance bonferroni

3

예측을 위해 칼만 필터링과 함께 DLM을 사용하는 방법

누군가 시계열에서 R에서 DLM Kalman 필터링을 사용하는 방법에 대한 예제를 안내해 줄 수 있습니까? 이 값 (연간 계절성을 가진 분기 값)이 있다고 가정합니다. 다음 값을 예측하기 위해 DLM을 어떻게 사용 하시겠습니까? 그리고 BTW, 충분한 과거 데이터가 있습니까 (최소한 무엇입니까)? 89 2009Q1 82 2009Q2 89 2009Q3 131 2009Q4 97 2010Q1 94 …

19 r time-series forecasting

1

이산 파라미터에 어떤 MCMC 알고리즘 / 기술이 사용됩니까?

연속 매개 변수, 특히 그라디언트 기반 방법을 피팅하는 데는 상당한 양이 있지만 이산 매개 변수를 피팅하는 것에 대해서는별로 알지 못합니다. 이산 파라미터를 맞추기 위해 일반적으로 사용되는 MCMC 알고리즘 / 기술은 무엇입니까? 상당히 일반적이고 강력한 알고리즘이 있습니까? 차원의 저주를 잘 다루는 알고리즘이 있습니까? 예를 들어 Hamiltonian MCMC는 일반적이고 강력하며 확장 성이 …

19 bayesian mcmc

4

R에서 자동 상관 오류가있는 간단한 선형 모형

닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 6 개월 전 . R에서 자동 상관 오차가있는 선형 모형을 어떻게 적합합니까? stata에서는 prais명령 을 사용 하지만 R에 해당하는 항목을 찾을 수 없습니다 ...

19 r time-series autocorrelation

3

베이지안 통계가 행동 연구에 대한 전통적 (자주적) 통계보다 진정으로 개선 되었습니까?

회의에 참석하는 동안 실험 결과를 평가하기위한 베이지안 통계의 옹호자들에 의해 약간의 추진이있었습니다. 그것은 잦은 통계보다 진지한 결과에 대한 민감성, 적절성 및 선택성 모두로 희미합니다. 나는이 주제를 어느 정도 살펴 보았고 지금까지 베이지안 통계를 사용할 때의 이점에 대해서는 확신이 없다. 그러나 베이지안 분석은 인식을 뒷받침하는 Daryl Bem 의 연구 를 반박하는 …

19 bayesian power frequentist

3

에서 샘플링하는 방법은

밀도에 따라 샘플링하고 싶습니다. f(a)∝cada−1Γ(a)1(1,∞)(a)f(a)∝cada−1Γ(a)1(1,∞)(a) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) 여기서ccc와ddd는 엄격하게 양수입니다. (동기 부여 : 감마 밀도의 모양 매개 변수가 사전에 균일 한 경우 Gibbs 샘플링에 유용 할 수 있습니다.) 누구나이 밀도에서 쉽게 샘플링하는 방법을 알고 있습니까? 어쩌면 그것은 표준이며 내가 모르는 것입니까? 나는 더 많거나 적은 작업 (모드를 …

19 distributions sampling gamma-distribution

4

회귀 분석에서 데이터 생성 프로세스와 모델의 차이점은 무엇입니까?

회귀 분석에서 '데이터 생성 프로세스'와 '모델'의 차이점은 무엇입니까?

19 econometrics

2

"가장 가까운 이웃"은 오늘 언제 의미가 있습니까?

1999 년 Beyer et al. 물었다 가 "가장 가까운 이웃"의미가? 1999 년 이후 NN 검색에서 거리 편평의 영향을 분석하고 시각화하는 더 좋은 방법이 있습니까? [주어진] 데이터 세트가 1-NN 문제에 대한 의미있는 답변을 제공합니까? 10-NN 문제? 100-NN 문제? 오늘날 전문가들이이 질문에 어떻게 접근 하시겠습니까? 월요일 1 월 24 일 수정 : …

19 machine-learning k-nearest-neighbour

2

선형 SVM 모델의 결정 경계 계산

선형 SVM의 지원 벡터가 주어지면 의사 결정 경계의 방정식을 어떻게 계산할 수 있습니까?

19 machine-learning svm

3

여러 사건의 조건부 확률을 어떻게 계산할 수 있습니까?

여러 이벤트의 조건부 확률을 어떻게 계산할 수 있습니까? 예를 들면 다음과 같습니다. P (A | B, C, D)-? 알아요 P (A | B) = P (A B) / P (B)∩∩\cap 그러나 불행히도 이벤트 A가 여러 변수에 의존하는 경우 수식을 찾을 수 없습니다. 미리 감사드립니다.

19 conditional-probability

7

모델 복잡성 측정

동일한 수의 매개 변수로 두 모델의 복잡성을 어떻게 비교할 수 있습니까? 편집 09/19 : 명확히하기 위해 모델 복잡성은 제한된 데이터에서 배우기가 얼마나 어려운지를 측정합니다. 두 모델이 기존 데이터에 동일하게 적합 할 경우 복잡성이 낮은 모델은 향후 데이터에 대한 오류를 줄입니다. 근사값을 사용하는 경우 기술적으로 항상 사실은 아니지만 실제로 적용되는 경향이 …

19 model-selection

1

2D 대응 분석 그림 해석

인터넷을 광범위하고 광범위하게 검색하고 있습니다. 아직 2D 대응 분석 플롯을 해석하는 방법에 대한 훌륭한 개요를 아직 찾지 못했습니다. 점 사이의 거리를 해석하는 데 조언을 줄 수 있습니까? 아마도 예가 도움이 될 것입니다. 여기서 통신 분석에 대해 논의한 많은 웹 사이트에서 발견 된 도표가 있습니다. 빨간색 삼각형은 눈 색깔을 나타내고 검은 …

19 interpretation correspondence-analysis biplot

10

데이터 시각화를 만드는 방법을 배우기위한 리소스?

http://flowingdata.com 에서 볼 수있는 시각화 유형을 만드는 방법을 배우고 정보 가 아름답습니다 . 편집 : 의미, 시각화 자체-NY Times 그래픽과 비슷합니다. 보고서에 대한 빠른 내용이 아닙니다. 이러한 도구를 만드는 데 어떤 도구가 사용됩니까? 대부분 Adobe Illustrator / Photoshop입니까? 특히 데이터 시각화를 위해 이러한 도구를 사용하는 방법을 배우는 데 유용한 자료 …

19 data-visualization

6

데이터 마이닝과 통계 분석의 차이점은 무엇입니까?

데이터 마이닝과 통계 분석의 차이점은 무엇입니까? 어떤 배경에서는 통계 교육이 다소 전통적이라고 생각합니다. 특정 질문이 제기되고 연구가 설계되며 데이터가 수집 및 분석되어 해당 질문에 대한 통찰력을 제공합니다. 결과적으로, 나는 항상 "데이터 준설 (data dredging)", 즉 큰 데이터 세트에서 패턴을 찾고 이러한 패턴을 사용하여 결론을 도출하는 것에 대해 회의적이었습니다. 나는 후자를 …

19 data-mining terminology analysis

6

매개 변수 추정을위한 머신 러닝의 '기본'아이디어는 무엇입니까?

모수 추정에 대한 통계의 '기본'아이디어는 최대 가능성 입니다. 기계 학습에서 해당 아이디어가 무엇인지 궁금합니다. Qn 1. 매개 변수 추정을위한 머신 러닝의 '기본'아이디어는 '손실 함수'라고 말할 수 있습니다. [참고 : 머신 러닝 알고리즘은 종종 손실 함수를 최적화하여 위의 질문에 대한 것입니다.] Qn 2 : 통계와 머신 러닝 사이의 격차를 해소하려는 문헌이 …

19 machine-learning maximum-likelihood loss-functions pac-learning