통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

2
표본 평균 및 표준을 사용하여 감마 분포 모수 추정
데이터 샘플에 가장 적합한 감마 분포 의 매개 변수를 추정하려고합니다 . 실제 값이 아닌 데이터 샘플 의 mean , std (및 variance ) 만 사용하고 싶습니다. 응용 프로그램에서 항상 사용할 수는 없기 때문입니다. 이 문서 에 따르면 모양과 스케일을 추정하기 위해 다음 공식을 적용 할 수 있습니다. 나는 이것을 내 …


1
멀티 클래스 부스트 분류기 보정
나는 Alexandru Niculescu-Mizil과 Rich Caruana의 논문 " 부스트에서 교정 된 확률 얻기 " 와이 글 에서 토론을 읽었다 . 그러나 여전히 멀티 클래스 부스팅 분류기 (의사 결정 그루터기가있는 부스트)의 출력을 보정하기 위해 물류 또는 Platt의 스케일링 을 이해하고 구현하는 데 여전히 어려움이 있습니다. 나는 일반화 된 선형 모델에 어느 정도 …

1
신경망에서 최적의 주간 기능 구성
회귀 문제를 다루면서 "요일"기능의 표현에 대해 생각하기 시작했습니다. 어떤 접근 방식이 더 나은지 궁금합니다. 하나의 특징; 월요일의 1/7 값; 화요일 2/7 ... 7 가지 특징 : 월요일의 (1, 0, 0, 0, 0, 0, 0); 화요일의 경우 (0, 1, 0, 0, 0, 0, 0) ... 네트워크 구성 차이로 인해 측정하기가 어렵습니다. …

5
'학습 학습'과 '도메인 적응'의 차이점은 무엇입니까?
'학습 학습'과 '도메인 적응'간에 차이가 있습니까? 나는 컨텍스트에 대해 잘 모르지만, 우리는 일부 데이터 세트 1을 가지고 그것을 훈련하고, 그 후에 우리는 처음부터 다시 학습하지 않고 모델을 적응시키고 싶어하는 또 다른 데이터 세트 2를 가지고 있습니다. '도메인 적응'은이 문제를 해결하는 데 도움이됩니다. Convolutional Neural Networks 분야에 따르면 : '학습 학습'이란 …

3
고정 효과를 사용하고 클러스터 SE를 사용하는 경우는 언제입니까?
당신은 개인이 그룹 내 위치 데이터의 단일 단면 (학교 내에서 예를 들어 학생)이 있고 형태의 모델 추정하고자하는 가정 개인 수준의 특성과의 벡터이다 상수를.Y_i = a + B*X_iXa 이 경우, 관찰되지 않은 군간 이질성 B은 귀하의 독립적 인 관심 변수와 상관 관계가 있기 때문에 귀하의 포인트 추정치 및 SE를 바이어스한다고 가정 …

1
“기능 공간”이란 무엇입니까?
"feature space"정의 예를 들어 SVM에 대해 읽을 때 "피처 공간으로 매핑"에 대해 읽었습니다. CART에 대해 읽을 때 "피처 공간으로 분할"에 대해 읽습니다. 특히 CART의 상황을 이해하고 있지만 누락 된 정의가 있다고 생각합니다. "피처 공간"에 대한 일반적인 정의가 있습니까? SVM 커널 및 / 또는 CART에 대한 통찰력을 제공하는 정의가 있습니까?

3
신경망은 함수 또는 확률 밀도 함수를 학습합니까?
통계적 추론과 신경망에 익숙하지 않기 때문에 질문이 조금 이상하게 들릴 수 있습니다. 신경망을 사용하는 분류 문제 에서 입력 x 의 공간을 출력 y 의 공간에 매핑 하는 함수 를 배우고 싶다고 말합니다 .f∗f∗f^*xxxyyy f∗(x;θ)=yf∗(x;θ)=yf^*(x; \theta) = y 비선형 함수를 모델링하거나 확률 밀도 함수를 모델링하기 위해 모수 ( θθ\theta )를 피팅하고 …

1
SARSA와 Q Learning을 동시에 선택해야하는시기
SARSA와 Q Learning은 모두 유사한 방식으로 작동하는 강화 학습 알고리즘입니다. 가장 큰 차이점은 SARSA는 정책에 있고 Q Learning은 정책에 있지 않다는 것입니다. 업데이트 규칙은 다음과 같습니다. Q 학습 : Q(st,at)←Q(st,at)+α[rt+1+γmaxa′Q(st+1,a′)−Q(st,at)]Q(st,at)←Q(st,at)+α[rt+1+γmaxa′Q(st+1,a′)−Q(st,at)]Q(s_t,a_t)←Q(s_t,a_t)+α[r_{t+1}+γ\max_{a'}Q(s_{t+1},a')−Q(s_t,a_t)] SARSA : Q(st,at)←Q(st,at)+α[rt+1+γQ(st+1,at+1)−Q(st,at)]Q(st,at)←Q(st,at)+α[rt+1+γQ(st+1,at+1)−Q(st,at)]Q(s_t,a_t)←Q(s_t,a_t)+α[r_{t+1}+γQ(s_{t+1},a_{t+1})−Q(s_t,a_t)] 여기서 st,atst,ats_t,\,a_trtrtr_t 및 r_t 는 시간 단계 ttt 에서의 상태, 동작 및 보상 이며 γγ\gamma 는 할인 …

3
로지스틱 회귀 분석은 이항 분포를 어떻게 사용합니까?
로지스틱 회귀가 이항 분포를 사용하는 방법을 이해하려고합니다. 새의 둥지 성공을 연구하고 있다고 가정 해 봅시다. 둥지가 성공할 확률은 0.6입니다. 이항 분포를 사용하여 n 번의 시도 (연구 된 둥지의 수)가 주어지면 r 성공 확률을 계산할 수 있습니다. 그러나 이항 분포는 모델링 컨텍스트에서 어떻게 사용됩니까? 일일 평균 기온이 둥지 성공에 어떤 영향을 …

4
Conv1D와 Conv2D의 차이점은 무엇입니까?
나는 케라 컨볼 루션 문서 를 겪고 있었고 Conv1D와 Conv2D의 두 가지 유형의 경련을 발견했습니다. 나는 웹 검색을했는데 이것이 Conv1D와 Conv2D에 대해 내가 이해하는 것입니다. Conv1D는 시퀀스에 사용되고 Conv2D는 이미지에 사용됩니다. 나는 항상 컨볼 루션 신경 네트워크가 이미지에만 사용되었고 CNN이 이런 식으로 시각화되었다고 생각했습니다. 이미지는 큰 행렬로 간주되며 필터가이 행렬 …

4
의사 레이블을 사용하는 것이 결과에 사소한 영향을 미치는 이유는 무엇입니까?
저는 반 감독 학습 방법을 조사 해왔고 "의사 라벨링"이라는 개념을 접했습니다. 내가 이해하는 것처럼 의사 레이블을 사용하면 레이블이없는 데이터뿐만 아니라 레이블이있는 데이터 세트가 있습니다. 먼저 레이블이 지정된 데이터에 대해서만 모델을 학습시킵니다. 그런 다음 해당 초기 데이터를 사용하여 레이블이없는 데이터를 분류 (임시 레이블 첨부)합니다. 그런 다음 레이블이 지정된 데이터와 레이블이없는 데이터를 …


3
회귀에 대한 임의의 포리스트가 '진정한 회귀'입니까?
임의 포리스트가 회귀에 사용됩니다. 그러나 내가 이해 한 바에 따르면 각 리프에 평균 목표 값을 할당합니다. 각 나무에는 잎이 제한되어 있으므로 회귀 모델에서 목표를 달성 할 수있는 특정 값만 있습니다. 따라서 (단계 함수와 같은) '이산'회귀가 아니라 '연속적'인 선형 회귀와 같지 않습니까? 이것을 올바르게 이해하고 있습니까? 그렇다면 랜덤 포리스트는 회귀에서 어떤 …

3
MCMC에 메모리가 없습니까?
프랑스 위키 백과 페이지에서 Markov 체인 Monte Carlo (MCMC)가 무엇인지 이해하려고합니다. 그들이 말하는 "는 마르코프 연쇄 몬테카를로 방법 벡터 생성 이루어져 있음 전용 벡터 데이터로부터 ", "메모리 않고 따라서 방법은"엑스나는엑스나는x_ {i}엑스난 − 1엑스나는−1x_ {i-1} Les méthodes de Monte-Carlo par chaînes de Markov 일관된 vecteur 고유성 partica de la donnée du …
18 mcmc 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.