통계 및 빅 데이터 machine-learning

2

부스팅 트리 모델에는 3 개의 튜닝 매개 변수가 있다는 것을 알고 있습니다. 트리 수 (반복 횟수) 수축 매개 변수 분할 수 (각 구성 요소의 크기) 내 질문은 : 각 튜닝 매개 변수에 대해 최적의 값을 어떻게 찾아야합니까? 그리고 어떤 방법? 수축 매개 변수와 트리 수 매개 변수는 함께 작동합니다. 즉, …

9 machine-learning cross-validation computational-statistics boosting gbm

4

다변량 기계 학습을 수행하는 방법? (여러 종속 변수 예측)

누군가 구매할 품목 그룹을 예측하려고합니다. 즉, 여러 개의 선형 선형 변수가 있습니다. 7 개 항목을 구매할 확률을 예측하기 위해 7 개 정도의 독립적 인 모델을 구축 한 다음 결과를 결합하기보다는 7 개의 관련 종속 변수 ( 그들이 구입할 수있는 것). R을 프로그래밍 언어로 사용하고 있으므로 R 관련 조언을 부탁드립니다.

9 r machine-learning multivariate-analysis

1

적절한 채점 규칙이 분류 설정에서 일반화에 대한 더 나은 추정치는 언제입니까?

분류 문제를 해결하는 일반적인 방법은 후보 모델 클래스를 식별 한 다음 교차 검증과 같은 일부 절차를 사용하여 모델 선택을 수행하는 것입니다. 일반적으로 가장 높은 정확도를 가진 모델을 선택하거나 다음과 같은 문제 별 정보를 인코딩하는 관련 기능을 선택합니다.에프βFβ\text{F}_\beta. 최종 목표가 정확한 분류 자 (정확도의 정의가 다시 문제에 의존하는 경우)를 생성하는 것으로 …

9 machine-learning model-selection error scoring-rules

2

여러 공간 해상도 / 스케일로 소스의 시계열 정보 연결

다른 센서에서 사용할 수있는 많은 위성 래스터 이미지가 있습니다. 이것들로부터, 더 거친 것들은 매우 풍부한 시간적 해상도를 갖는다. 중간 해상도 래스터는 수집 날짜가 적지 만 여전히 어느 정도의 정보를 사용할 수 있습니다. 더 정밀한 해상도는 2 년 미만에 2 ~ 6 개의 관측 된 날짜에 걸쳐 매우 낮은 시간 해상도를 …

9 time-series machine-learning predictive-models multivariate-regression

1

이벤트 예측을위한 숨겨진 Markov 모델

질문 : 숨겨진 Markov 모델의 현명한 구현 아래 설정이 있습니까? 전체 관측 시간 동안 108,000관찰 한 데이터 세트 (100 일 동안 수행)와 대략적인 2000이벤트가 있습니다. 데이터는 아래 그림과 같이 관찰 된 변수가 3 개의 개별 값 취할 수 있고 빨간색 열은 이벤트 시간, 즉 강조 표시합니다 .[ 1 , 2 …

9 time-series machine-learning predictive-models markov-chain hidden-markov-model

6

hadoop / map-reduce를 사용하여 확장 할 수있는 기계 학습 알고리즘

확장 가능한 머신 러닝 알고리즘은 요즘 유행하는 것처럼 보입니다. 모든 회사는 큰 데이터를 처리하지 않습니다 . Map-Reduce와 같은 병렬 아키텍처를 사용하여 어떤 머신 러닝 알고리즘을 확장 할 수 있는지, 어떤 알고리즘을 사용할 수 없는지에 대한 교과서가 있습니까? 아니면 관련 논문?

9 machine-learning large-data

3

LDA 대 퍼셉트론

LDA가 다른지도 학습 기술 내에서 어떻게 '적합'하는지 느끼려고 노력하고 있습니다. LDA에 대한 LDA-esque 게시물을 이미 읽었습니다. 나는 이미 퍼셉트론에 익숙하지만 지금은 LDA를 배우고 있습니다. LDA는지도 학습 알고리즘 제품군에 어떻게 적합합니까? 다른 방법에 비해 단점은 무엇이며 더 잘 사용할 수있는 방법은 무엇입니까? 예를 들어 퍼셉트론을 사용할 수있을 때 왜 LDA를 사용합니까?

9 machine-learning classification discriminant-analysis supervised-learning

1

R / 캐럿 : 교육 및 테스트 세트와 교차 검증?

이것은 아마도 어리석은 질문 일지 모르지만 캐럿이있는 모델을 생성하고 LOOCV또는 (또는 더 많은 지점까지) 사용 LGOCV하면 본질적으로 교차 유효성 검사 단계 인 경우 데이터를 기차와 테스트 세트로 분할하는 이점은 무엇입니까 어쨌든? 관련 질문 중 일부를 읽었으며 일부 교차 유효성 검사 방법 (예 : 캐럿 사이트에서 여기에 설명 된 방법 )은 …

9 r machine-learning cross-validation caret

2

사전의 제복은 어떻게 최대 우도 및 사후 모드에서 동일한 추정치를 도출합니까?

나는 다른 점 추정 방법을 연구하고 있으며 MAP 대 ML 추정을 사용할 때 "균일 이전"을 사용할 때 추정치가 동일하다는 것을 읽습니다. 누군가 "균일 한"사전이 무엇인지 설명하고 MAP 및 ML 추정기가 동일한시기에 대한 간단한 예를 제시 할 수 있습니까?

9 machine-learning probability bayesian estimation maximum-likelihood

1

통계 학습 이론 VS 전산 학습 이론?

통계 학습 이론 과 전산 학습 이론 과 어떤 관계와 차이점이 있는가? 그들은 같은 주제에 관한 것입니까? 같은 문제를 해결하고 같은 방법을 사용합니까? 예를 들어, 전자는 예측 이론 (회귀, 분류 등)이라고 말합니다.

9 machine-learning statistical-learning artificial-intelligence

1

계량 경제학에 텍스트 마이닝 / 자연어 처리 도구 사용

이 질문이 여기에 완전히 적합한 지 잘 모르겠습니다. 그렇지 않은 경우 삭제하십시오. 저는 경제학을 전공하는 대학원생입니다. 사회 보험 문제를 조사하는 프로젝트의 경우, 자격 평가를 다루는 수많은 행정 사건 보고서 (> 200k)에 접근 할 수 있습니다. 이러한 보고서는 개별 관리 정보에 연결될 수 있습니다. 양적 분석에 사용할 수있는 보고서에서 grep/ awk등을 …

9 machine-learning data-mining econometrics text-mining natural-language

2

레코드 연결에 EM 알고리즘 사용

이름, 성 및 생년월일로 두 데이터 집합의 레코드를 연결하는 데 관심이 있습니다. EM 알고리즘으로 이것이 가능할 수 있습니까? 그렇다면 그렇다면 어떻게해야합니까? Carl McCarthy, 1967. 예를 들어 1st의 다음 레코드를 고려하십시오. 두 번째 데이터 집합의 모든 레코드를 검색하고 이름과 Carl 사이의 jaro-winkler 거리와 성과 McCarthy 사이의 jaro-winkler 거리를 할당합니다. 이 거리는 …

9 machine-learning stata expectation-maximization record-linkage perl

2

선형 회귀 분석에서 경사 하강에 대한 최적 학습 속도 결정

경사 하강에 대한 최적의 학습률을 어떻게 결정할 수 있습니까? 비용 함수가 이전 반복보다 더 큰 값을 반환하면 알고리즘이 자동으로 조정할 수 있다고 생각합니다 (알고리즘이 수렴하지 않음). 어떻게 새로운 값을 가져야할지 확실하지 않습니다.

9 regression machine-learning gradient-descent

1

선형 동적 시스템과 관련된 혼란

나는 Bishop의이 책인 Pattern Recognition and Machine Learning을 읽고있었습니다. 나는 선형 역학 시스템의 파생과 관련하여 혼란을 겪었습니다. LDS에서는 잠재 변수가 연속적이라고 가정합니다. Z가 잠재 변수를 나타내고 X가 관측 변수를 나타내는 경우 p (지엔|지n - 1) = N(지엔| ㅏ지n - 1, τ)p(zn|zn−1)=N(zn|Azn−1,τ)p(z_n|z_{n-1}) = N(z_n|Az_{n-1},\tau) p (엑스엔|지엔) = N(엑스엔, C지엔, Σ )p(xn|zn)=N(xn,Czn,Σ)p(x_n|z_n) …

9 machine-learning linear-model kalman-filter pattern-recognition graphical-model

2

로지스틱 손실 기능으로 매트릭스 인수 분해를 통한 협업 필터링

협업 필터링 문제를 고려하십시오. #users * #items 크기의 행렬 이 있습니다. 사용자 i가 항목 j를 좋아하면 이고, 사용자 i가 항목 j를 좋아하지 않으면 이고(i, j) 쌍에 대한 데이터가없는 경우 향후 사용자, 항목 쌍에 대한 를 예측하려고합니다 .MMMMi,j=1Mi,j=1M_{i,j} = 1Mi,j=0Mi,j=0M_{i,j} = 0미디엄I , J= ?Mi,j=?M_{i,j}=?미디엄I , JMi,jM_{i,j} 표준 협력 필터링 방식은 …

9 machine-learning recommender-system matrix-decomposition

«machine-learning» 태그된 질문