통계 및 빅 데이터 machine-learning

2

lasso에 대해 다른 구현 소프트웨어를 사용할 수 있습니다 . 다른 포럼에서 베이지안 접근 방식과 잦은 접근 방식에 대해 많이 논의했습니다. 내 질문은 올가미에 매우 구체적 입니다. 베이 시안 올가미와 일반 올가미의 차이점 또는 장점은 무엇입니까 ? 다음은 패키지 구현의 두 가지 예입니다. # just example data set.seed(1233) X <- scale(matrix(rnorm(30),ncol=3))[,] …

24 r machine-learning linear-model lasso

2

자동 인코더는 의미있는 기능을 배울 수 없습니다

이 두 가지와 같은 50,000 개의 이미지가 있습니다. 그들은 데이터 그래프를 묘사합니다. 이 이미지에서 기능을 추출하고 싶어서 Theano (deeplearning.net)에서 제공하는 자동 인코더 코드를 사용했습니다. 문제는 이러한 자동 인코더가 기능을 배우지 않는 것입니다. RBM을 시도했지만 동일합니다. MNIST 데이터 세트는 훌륭한 기능을 제공하지만 내 데이터가 전혀 생성되지 않는 것 같습니다. 아래 예제를 …

24 machine-learning neural-networks feature-construction rbm autoencoders

3

분류 성능을 평가하기위한 교차 검증 또는 부트 스트랩?

특정 데이터 세트에서 분류기의 성능을 평가하고이를 다른 분류기와 비교하는 가장 적합한 샘플링 방법은 무엇입니까? 교차 검증은 표준 관행 인 것처럼 보이지만 .632 부트 스트랩과 같은 방법이 더 나은 선택임을 읽었습니다. 후속 조치 : 성능 지표 선택이 답변에 영향을 미칩니 까 (정확성 대신 AUC를 사용하는 경우)? 나의 궁극적 인 목표는 한 …

24 machine-learning classification predictive-models cross-validation bootstrap

3

일별 시계열 분석

시계열 분석을 시도하고 있으며이 분야에 익숙하지 않습니다. 저는 2006-2009 년부터 매일 이벤트를보고 있으며 시계열 모델에 맞추고 싶습니다. 내가 한 진보는 다음과 같습니다. timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) 결과 플롯은 다음과 같습니다. 데이터에 계절 성과 추세가 있는지 확인하기 위해이 게시물에 언급 된 단계를 따릅니다 . ets(x) fit <- tbats(x) seasonal <- !is.null(fit$seasonal) …

24 r time-series seasonality multiple-seasonalities tbats hypothesis-testing beta-distribution machine-learning unsupervised-learning supervised-learning reinforcement-learning

7

모델을 작성 중이며 지리적 위치가 타겟 변수를 예측하는 데 매우 적합하다고 생각합니다. 각 사용자의 우편 번호가 있습니다. 그래도 모델에서 우편 번호를 예측 기능으로 포함시키는 가장 좋은 방법은 확실하지 않습니다. 우편 번호는 숫자이지만 숫자가 올라가거나 내려 가면 아무 의미가 없습니다. 30,000 개의 우편 번호를 모두 이진화 한 다음 기능이나 새 열로 …

24 machine-learning feature-construction many-categories

3

희소 PCA가 PCA보다 정확히 어떻게 더 좋습니까?

수업 전에 몇 가지 강의에서 PCA에 대해 배웠고이 매혹적인 개념에 대해 더 많이 알게되면서 희소 한 PCA에 대해 알게되었습니다. 내가 틀리지 않은지 물어보고 싶었다. 이것은 희소 한 PCA이다. PCA에서, 변수 를 가진 데이터 점이 있다면 , PCA를 적용하기 전에 차원 공간 에서 각 데이터 점을 나타낼 수있다 . PCA를 적용한 …

24 machine-learning pca sparse

3

가우스 커널의 기능 맵

SVM에서 가우스 커널은 다음과 같이 정의됩니다. 여기서 x, y \ in \ mathbb {R ^ n} 입니다. \ phi 의 명시 적 방정식을 모른다 . 알고 싶습니다.x,y∈RnϕK(x,y)=exp(−∥x−y∥222σ2)=ϕ(x)Tϕ(y)K(x,y)=exp⁡(−‖x−y‖222σ2)=ϕ(x)Tϕ(y)K(x,y)=\exp\left({-\frac{\|x-y\|_2^2}{2\sigma^2}}\right)=\phi(x)^T\phi(y)x,y∈Rnx,y∈Rnx, y\in \mathbb{R^n}ϕϕ\phi 또한 ∑iciϕ(xi)=ϕ(∑icixi)∑iciϕ(xi)=ϕ(∑icixi)\sum_ic_i\phi(x_i)=\phi \left(\sum_ic_ix_i \right) 여기서 c_i \ in \ mathbb R 인지 알고 싶습니다 ci∈Rci∈Rc_i\in \mathbb R. 커널을 사용하면 선형 클래스가 …

24 machine-learning svm kernel-trick

2

필터 매트릭스의 요소를 초기화하는 방법은 무엇입니까?

라이브러리 (Convnet 또는 TensorFlow와 같은)에 의존하지 않는 Python 코드를 작성하여 회선 신경 네트워크를 더 잘 이해하려고 노력하고 있으며 커널 매트릭스의 값을 선택하는 방법에 대한 문헌에 갇혀 있습니다. 이미지에서 컨볼 루션을 수행합니다. 아래 그림의 CNN 계층을 보여주는 기능 맵 사이의 단계에서 구현 세부 사항을 이해하려고합니다 . 이 다이어그램에 따르면 : 커널 …

24 machine-learning neural-networks deep-learning feature-construction conv-neural-network

4

신경망 / ML 알고리즘의 * 이론 *에 관한 교과서?

지금까지 본 모든 교과서는 ML 알고리즘과 그 구현 방법을 설명합니다. 해당 알고리즘의 동작에 대한 이론과 증명을 구축하는 교과서도 있습니까? 예를 들어 조건 에서 경사 하강은 항상 ?x , y, zx,y,zx,y,zA , B , CA,B,CA,B,C

23 machine-learning mathematical-statistics references algorithms

5

순전히 예측 모델링을 수행 할 때 탐색 적 데이터 분석이 중요합니까?

기계 학습 기술을 사용하여 예측 모델을 구축 할 때 탐색 적 데이터 분석 (EDA)의 요점은 무엇입니까? 기능 생성 및 모델 작성으로 바로 넘어가도 되나요? EDA에서 사용되는 기술 통계량은 어떻게 중요합니까?

23 machine-learning predictive-models descriptive-statistics eda

4

최적화 알고리즘이 다른 최적화 문제로 정의되는 이유는 무엇입니까?

기계 학습을위한 최적화 기술에 대한 연구를하고 있지만 다른 최적화 문제와 관련하여 많은 수의 최적화 알고리즘이 정의되어 있다는 사실에 놀랐습니다. 다음은 몇 가지 예를 보여줍니다. 예를 들어 https://arxiv.org/pdf/1511.05133v1.pdf 모든 것이 멋지고 좋아 보이지만 업데이트에 가 있습니다 . 대해 해결되는 알고리즘은 무엇 입니까? 우리는 알지 못합니다. 마술처럼 우리는 내부 벡터가 최소가되도록 최소화 …

23 machine-learning svm optimization

1

TensorBoard에서 TensorFlow가 제공 한 히스토그램을 어떻게 해석합니까?

나는 최근에 텐서 흐름을 실행하고 배우고 있었고 해석하는 방법을 모르는 몇 가지 히스토그램을 얻었습니다. 보통 막대의 높이를 주파수 (또는 상대 주파수 / 카운트)로 생각합니다. 그러나 일반적인 히스토그램에서와 같이 막대가 없으며 사물이 음영 처리된다는 사실이 혼란스러워합니다. 한 번에 많은 선 / 높이가있는 것 같습니까? 다음 그래프를 해석하는 방법을 아는 사람이 있습니까 …

23 machine-learning neural-networks conv-neural-network tensorflow

2

최종 데이터 (생산 준비) 모델을 완전한 데이터 또는 훈련 세트에 대해서만 훈련해야합니까?

훈련 세트에 대해 여러 모델을 훈련시키고 교차 검증 세트를 사용하여 최상의 모델을 선택하고 테스트 세트에서 성능을 측정했다고 가정합니다. 이제 최종 최고의 모델이 하나 있습니다. 사용 가능한 모든 데이터 또는 훈련 세트에 대해서만 훈련 된 선박 솔루션에 대해 교육해야합니까? 후자의 경우 왜? 업데이트 : @ P.Windridge가 지적했듯이 재교육 모델을 배송하는 것은 …

23 machine-learning validation regression-strategies

4

수학자를위한 머신 러닝 소개

어떤 의미에서 이것은 math.stackexchange 에서 얻은 크로스 포스트이며이 사이트가 광범위한 대상을 제공 할 수 있다고 생각합니다. 기계 학습에 대한 수학적 소개를 찾고 있습니다. 특히, 찾을 수있는 많은 문헌은 비교적 부정확하며 많은 페이지가 내용없이 사용됩니다. 그러나 문학에서 시작, 내가 발견 한 코 세라의 앤드류 응, 패턴 인식에 주교의 책과 Smola의 마지막 …

23 machine-learning references pac-learning

2

주제 모델의 주제 안정성

일련의 개방형 에세이의 내용에 대한 정보를 추출하려는 프로젝트를 진행 중입니다. 이 특정 프로젝트에서 148 명이 더 큰 실험의 일환으로 가상의 학생 조직에 대한 에세이를 썼습니다. 내 분야 (사회 심리학)에서 이러한 데이터를 분석하는 일반적인 방법은 수필로 수필을 코딩하는 것이지만 수작업으로 코딩하는 것은 노동 집약적이며 너무 주관적이기 때문에 정량적으로 수행하고 싶습니다. 미각. …

23 machine-learning model-selection small-sample topic-models dirichlet-process

«machine-learning» 태그된 질문