통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

2
확률 불평등
무한한 랜덤 변수의 합계에 대한 확률 불평등을 찾고 있습니다. 누군가 나에게 몇 가지 생각을 줄 수 있다면 정말 감사하겠습니다. 내 문제는 두 개의 iid Gaussian의 곱셈 인 무한한 iid 랜덤 변수의 합이 특정 값을 초과 할 확률에 대한 지수 상한을 찾는 것입니다. 즉, 여기서 , 및 는 에서 iid로 생성됩니다 …

3
StackExchange 웹 사이트에서 머신 러닝 방법 적용
이번 학기 에는 머신 러닝 과정이 있으며 교수는 실제 문제 를 찾아 수업에 도입 된 머신 러닝 방법 중 하나를 통해 해결 하도록 요청 했습니다. 의사 결정 트리 인공 신경망 벡터 머신 지원 인스턴스 기반 학습 ( kNN , LWL ) 베이지안 네트워크 강화 학습 나는 stackoverflow 및 stackexchange 의 …


5
특징적인 기능의 목적은 무엇입니까?
나는 평신도의 관점에서 누군가가 특징적인 기능이 무엇이며 실제로 어떻게 사용되는지 설명 할 수 있기를 바랍니다. 나는 그것이 PDF의 푸리에 변환이라는 것을 읽었으므로 그것이 무엇인지 알 것 같지만 여전히 그 목적을 이해하지 못합니다. 누군가가 목적에 대한 직관적 인 설명과 일반적으로 사용되는 방법에 대한 예를 제공 할 수 있다면 환상적입니다! 마지막 참고 …

2
선형 회귀 분석에서 표준화 된 설명 변수를 사용하는시기와 방법
선형 회귀에 대한 두 가지 간단한 질문이 있습니다. 설명 변수를 표준화하는 것이 언제 권장됩니까? 일단 표준화 된 값으로 평가를 수행하면 새로운 값으로 어떻게 예측할 수 있습니까 (새로운 값을 어떻게 표준화해야합니까)? 일부 참조가 도움이 될 것입니다.

5
일하는 통계 학자들은 빈번주의와 베이지안 추론의 차이에 관심을 가지고 있습니까?
외부인으로서 통계적 추론을 수행하는 방법에 대한 두 가지 경쟁 견해가있는 것으로 보입니다. 작업 통계학자가 두 가지 방법을 모두 유효한 것으로 간주합니까? 하나를 선택하는 것이 더 철학적 인 질문으로 간주됩니까? 아니면 현재의 상황이 문제가되고 다른 접근법을 어떻게 통일하려고합니까?

11
오픈 소스 통계 교과서?
무료 통계 교과서 와 같은 통계 교과서 에 대한 몇 가지 질문이 있습니다 . 그러나 저는 Creative Commons 라이센스 가있는 오픈 소스 인 교과서를 찾고 있습니다. 그 이유는 다른 도메인의 강의 자료에서도 여전히 기본 통계에 대한 일부 텍스트를 포함하고 싶어하기 때문입니다. 이 경우 기존 자료를 다시 작성하는 대신 기존 자료를 …


7
인과 추론에 교차 검증을 사용할 수 있습니까?
모든 상황에서 교차 검증에 익숙하며 예측 정확도를 높이기위한 목적으로 만 사용됩니다. 변수 간의 편견없는 관계를 추정 할 때 교차 검증 논리를 확장 할 수 있습니까? 하지만 이 리처드 버크에 의해 용지가 "최종"회귀 모델의 매개 변수 선택을위한 샘플 밖으로 보류를 사용하는 방법을 보여줍니다 (및 계단식 매개 변수의 선택은 좋은 생각이 아니다 …

7
정규화로 인해 데이터에 대한 Deep Neural Nets 기아가 해결되지 않는 이유는 무엇입니까?
일반적으로 Neural Networks 및 Deep Neural Networks와 관련하여 자주 제기되는 문제는 "데이터가 배고프다"는 것입니다. 즉, 큰 데이터 세트가 없으면 제대로 수행되지 않습니다. 네트워크 훈련을 위해 내 이해는 이것이 NNets, 특히 Deep NNets가 많은 자유도를 가지고 있기 때문입니다. 따라서 모델로서 NNet에는 매우 많은 수의 매개 변수가 있으며, 모델의 매개 변수 수가 …

1
로지스틱 회귀 출력, 카이 제곱 검정 및 OR에 대한 신뢰 구간에서 p- 값이 다른 이유는 무엇입니까?
처리 후 ( Curevs No Cure) 결과 변수를 치료하는 로지스틱 회귀 분석을 작성했습니다 . 이 연구의 모든 환자는 치료를 받았다. 당뇨병이이 결과와 관련이 있는지 확인하고 싶습니다. R에서 로지스틱 회귀 출력은 다음과 같습니다. Call: glm(formula = Cure ~ Diabetes, family = binomial(link = "logit"), data = All_patients) ... Coefficients: Estimate Std. …

2
t-SNE는 언제 오도합니까?
저자 중 한 사람으로부터 인용 : t- 분산 스토캐스틱 이웃 임베딩 (t-SNE)은 차원 축소를위한 ( 상을 수상한 ) 기법으로, 특히 고차원 데이터 세트의 시각화에 매우 적합합니다. 꽤 들리지만 저자가 말하는 것입니다. 저자의 또 다른 인용문 (앞서 언급 한 경쟁) : 이 경쟁에서 무엇을 빼앗 았습니까? 데이터에 대한 예측 변수를 교육하기 …

3
R의 난수 집합 시드 (N) [중복]
이 질문에는 이미 답변이 있습니다. 난수 생성기의 씨앗은 정확히 무엇입니까? 답변 3 개 나는 set.seed()의사 난수 생성을 위해 R에서 사용한다는 것을 알고 있습니다. 또한 같은 숫자를 사용하면 set.seed(123)결과를 재현 할 수 있습니다. 그러나 내가 얻지 못하는 것은 값 자체가 의미하는 것입니다. 나는 몇 가지 기능을 재생, 일부 사용하고 set.seed(1)또는 set.seed(300)나 …

3
간단한 선형 회귀 분석에서 회귀 계수의 편차 도출
간단한 선형 회귀 분석에서 y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u . 여기서 u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . 추정값을 도출했습니다 : β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , 여기서x¯x¯\bar{x} 및y¯y¯\bar{y} 는xxx와y의 표본 평균입니다.yyy . 지금은의 분산 찾으려면 β 1 . 나는 …

4
예측과 예측의 차이?
예측과 예측의 차이점과 관계가 궁금합니다. 특히 시계열과 회귀 분석에서? 예를 들어, 나는 다음을 정정하고 있습니까? 시계열에서 예측은 시계열의 과거 값이 주어진 미래 값을 추정하는 것을 의미합니다. 회귀에서 예측은 주어진 데이터의 미래, 현재 또는 과거의 값을 추정하는 것을 의미하는 것으로 보입니다. 감사합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.