통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

3
강화 학습에서 할인 요소의 역할 이해
나는 강화 학습에 대해 스스로 가르치고 있으며 할인 보상의 개념을 이해하려고 노력하고 있습니다. 따라서 어떤 상태-행동 쌍이 좋고 어떤 것이 나쁜지를 시스템에 알리려면 보상이 필요합니다. 그러나 내가 이해하지 못하는 것은 할인 된 보상이 필요한 이유입니다. 좋은 상태에 도달하는 것이 나중에가 아니라 빨리 이루어지는 것이 왜 중요한가? 나는 이것이 특정한 경우에 …

3
반복 된 기대 법칙의 일반화
나는 최근에이 정체성을 발견했다. 이자형[ E( Y| 엑스, Z) | 엑스] = E[ Y| 엑스]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] 물론 그 규칙의 더 간단한 버전, 즉 익숙 이자형[ E( Y| 엑스) ] =E( Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E \left(Y\right) 하지만 일반화에 대한 …

3
베이지안 관점에서 부트 스트랩을 해석 할 수 있습니까?
좋아, 이것은 밤에 나를 유지시키는 질문이다. 부트 스트랩 절차를 베이지안 부트 스트랩을 제외한 일부 베이지안 절차와 비슷하게 해석 할 수 있습니까? 나는 정말 통일되고 이해하기 쉬운 통계의 베이지안 "통역"을 정말 좋아합니다. 그러나 나는 또한 부트 스트랩 절차에 약점이있어 매우 간단하지만 많은 상황에서 합리적인 추론을 제공합니다. 부트 스트랩이 어떤 의미에서 사후 …

2
MA (q) 시계열 모델을 "이동 평균"이라고하는 이유는 무엇입니까?
시계열과 관련하여 "이동 평균"을 읽을 때 또는0.5xt-1+0.3xt-2+0.2xt-3과 같은 가중 평균. (이것은 실제로 AR (3) 모델이라는 것을 알고 있지만 이것이 내 두뇌로 이동하는 것입니다.) MA (q) 모델이 왜 오류 용어 또는 "혁신"의 수식입니까? {ϵ}은 (는) 이동 평균과어떤 관계가있습니까? 나는 분명한 직관이 빠진 것 같습니다.( xt - 1+ xt - 2+ xt …

4
이항 랜덤 변수의 표본 평균에 대한 표준 오차
내가 2 개의 결과를 가질 수있는 실험을 실행 중이고 2 개의 결과의 기본 "진정한"분포가 모수 엔nn 및 갖는 이항 분포라고 가정합니다 피pp. B i n o m i a l (n,p)Binomial(n,p){\rm Binomial}(n, p) . 표준 오류를 계산할 수 있습니다. 에스이자형엑스= σ엑스엔√SEX=σXnSE_X = \frac{\sigma_X}{\sqrt{n}} 의 변화의 형태로부터 B i n o …

4
불균형 데이터에 대한 의사 결정 트리 교육
데이터 마이닝을 처음 사용하고 있으며 불균형이 심한 데이터 세트에 대해 의사 결정 트리를 훈련하려고합니다. 그러나 예측 정확도가 좋지 않습니다. 데이터는 코스를 공부하는 학생들로 구성되며 클래스 변수는 취소됨 또는 현재의 두 값을 갖는 코스 상태입니다. 나이 민족 성별 코스 ... 코스 상태 데이터 세트에는 Withdrawn보다 Current 인 인스턴스가 더 많습니다. 철회 …

3
로지스틱 회귀 분석을위한 정규화 방법
Ridge, Lasso, ElasticNet과 같은 방법을 사용한 정규화는 선형 회귀에 매우 일반적입니다. 다음을 알고 싶었습니다.이 방법이 로지스틱 회귀에 적용 가능합니까? 그렇다면 로지스틱 회귀 분석에 사용해야하는 방식에 차이가 있습니까? 이러한 방법을 적용 할 수없는 경우 어떻게 로지스틱 회귀를 정규화합니까?

2
신경망에서 maxout이란 무엇입니까?
신경망에서 maxout 단위가 무엇인지 설명 할 수 있습니까? 그들은 어떻게 수행하고 기존 장치와 어떻게 다릅니 까? Goodfellow 등 의 2013 "Maxout Network" 논문 을 읽으려고했습니다 . (요슈아 벤 지오 교수의 그룹에서), 그러나 나는 그것을 얻지 못합니다.


9
통계를 가르 칠 때 "정상"또는 "가우시안"을 사용합니까?
내 책에서 주로 "가우스 분포"를 사용하지만 누군가가 "정규 분포"로 전환하도록 제안했습니다. 초보자에게 사용할 용어에 대한 합의가 있습니까? 물론 두 용어는 동의어 이므로 이것은 물질에 대한 질문이 아니라 순전히 어떤 용어가 더 일반적으로 사용되는지의 문제입니다. 그리고 물론 두 용어를 모두 사용합니다. 그러나 어느 것을 주로 사용해야합니까?


3
적합 다중 회귀 모형을 시각화하는 방법은 무엇입니까?
현재 여러 회귀 분석으로 논문을 작성하고 있습니다. 일 변량 선형 회귀를 시각화하는 것은 산점도를 통해 쉽지만 여러 선형 회귀를 시각화하는 좋은 방법이 있는지 궁금합니다. 나는 현재 종속 변수 대 1 독립 변수, 2 대 독립 변수 등과 같은 산점도를 플롯하고 있습니다. 제안은 정말 감사하겠습니다.

5
평균적으로 각 부트 스트랩 샘플에 대략 2/3의 관측치가 포함되는 이유는 무엇입니까?
나는 각각의 부트 스트랩 샘플 (또는 자루에 넣어 나무) 평균 약 포함 할 것을 주장에 걸쳐 실행 한 2/32/32/3 관측을. 그럴 가능성은 어떤에서 선택되는 것을 이해 nnn 에서 그립니다 nnn 교체가와 샘플 (1−1/n)n(1−1/n)n(1- 1/n)^n 약에 밖으로 작동하는 1/31/31/3 선택하지의 기회. 이 공식은 항상 제공하는 이유에 대한 수학적 설명은 무엇입니까 ≈1/3≈1/3\approx …
42 bootstrap 

4
GARCH와 ARMA의 차이점은 무엇입니까?
혼란 스러워요. ARMA와 GARCH 프로세스의 차이점을 이해하지 못합니다. 다음은 (G) ARCH (p, q) 프로세스입니다 σ2t=α0+∑i=1qαir2t−iARCH+∑i=1pβiσ2t−iGARCHσt2=α0+∑i=1qαirt−i2⏟ARCH+∑i=1pβiσt−i2⏟GARCH\sigma_t^2 = \underbrace{ \underbrace{ \alpha_0 + \sum_{i=1}^q \alpha_ir_{t-i}^2} _{ARCH} + \sum_{i=1}^p\beta_i\sigma_{t-i}^2} _{GARCH} 그리고 여기 ARMA ( )가 있습니다 :p,qp,qp, q Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i.Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i. X_t = c + \varepsilon_t + \sum_{i=1}^p \varphi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\, ARMA는 단순히 …
42 arima  garch  finance 

4
Taylor 시리즈 (특히 나머지)에 대한 기대
내 질문은 널리 사용되는 방법, 즉 Taylor Series의 예상 가치를 취하는 방법을 정당화하려는 것입니다. 양의 평균 및 분산 인 임의의 변수 가 있다고 가정합니다 . 또한 와 같은 함수가 있습니다 .XXXμμ\muσ2σ2\sigma^2log(x)log⁡(x)\log(x) 평균 주위에서 확장하면 여기서 평소와 같이 는 st.logXlog⁡X\log XlogX=logμ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξ3X,log⁡X=log⁡μ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξX3, \log X = \log\mu + \frac{X - \mu}{\mu} - \frac12 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.