«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.

4
LSTM 시계열 예측 주위의 예측 구간
LSTM (또는 다른 반복적) 신경망으로부터 시계열 예측에 대한 예측 간격 (확률 분포)을 계산하는 방법이 있습니까? 예를 들어, 마지막 10 개의 관측 된 샘플 (t-9 ~ t)을 기반으로 미래에 10 개의 샘플 (t + 1 ~ t + 10)을 예측한다고 가정하면, t + 1에서의 예측은 더 많을 것으로 예상됩니다 t + …


3
Keras의 model.predict 함수 출력은 무엇을 의미합니까?
Quora 공식 데이터 세트에서 중복 질문을 예측하기 위해 LSTM 모델을 만들었습니다. 테스트 레이블은 0 또는 1입니다. 1은 질문 쌍이 중복되었음을 나타냅니다. 를 사용하여 모델을 빌드 한 후 테스트 데이터를 model.fit사용하여 모델을 model.predict테스트합니다. 출력은 아래와 같은 값의 배열입니다. [ 0.00514298] [ 0.15161049] [ 0.27588326] [ 0.00236167] [ 1.80067325] [ 0.01048524] [ …


1
XGBRegressor와 xgboost의 속도 차이가 큰가?
다음 코드를 사용하여 모델을 훈련시키는 경우 : import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) 약 1 분 후에 완료됩니다. Sci-Kit 학습 방법을 사용하여 모델을 훈련시키는 경우 : import …

2
비대칭 비용 함수를 사용한 선형 회귀?
나는 어떤 값을 예측하려는 Y(x)Y(x)Y(x) 나는 몇 가지 예측을 얻기 위해 노력하고 Y ( X ) 가능한 한 낮게되고, 여전히보다 큰 사이를 최적화를 . 즉, Y^(x)Y^(x)\hat Y(x)Y(x)Y(x)Y(x)cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}cost{Y(x)≳Y^(x)}>>cost{Y^(x)≳Y(x)}\text{cost}\left\{ Y(x) \gtrsim \hat Y(x) \right\} >> \text{cost}\left\{ \hat Y(x) \gtrsim Y(x) \right\} 간단한 선형 회귀는 완전히 잘되어야한다고 생각합니다. 그래서 나는 이것을 수동으로 구현하는 …

3
언밸런스 클래스를 사용하면 유효성 검사 / 테스트 데이터 세트에서 샘플링을 사용해야합니까?
저는 기계 학습의 초보자이며 상황에 직면하고 있습니다. IPinYou 데이터 세트로 실시간 입찰 문제를 해결 중이며 클릭 예측을 시도하고 있습니다. 문제는 알 수 있듯이 데이터 세트의 균형이 매우 불균형하다는 것입니다. 1 긍정적 인 예 (클릭)에 대해 약 1300 개의 부정적인 예 (비 클릭). 이것이 제가하는 것입니다: 데이터로드 데이터 세트를 3 개의 …


2
심층 신경망 훈련 시각화
훈련 중에 가중치를 플롯하기 위해 멀티 레이어 네트워크에 해당하는 Hinton Diagrams를 찾으려고합니다. 훈련 된 네트워크는 Deep SRN과 다소 유사합니다. 즉, 여러 개의 힌튼 다이어그램의 동시 플롯을 시각적으로 혼란스럽게 만드는 다중 가중치 매트릭스가 많이 있습니다. 누구나 여러 계층의 반복 네트워크에 대한 가중치 업데이트 프로세스를 시각화하는 좋은 방법을 알고 있습니까? 주제에 관한 …

2
NLP의 분류 프로세스에서 구문 분석 트리에서 일반적으로 사용되는 기능은 무엇입니까?
다른 유형의 구문 분석 트리 구조를 탐색하고 있습니다. 널리 알려진 두 가지 구문 분석 트리 구조는 a) 구성 요소 기반 구문 분석 트리 및 b) 종속성 기반 구문 분석 트리 구조입니다. Stanford NLP 패키지를 사용하여 두 가지 유형의 구문 분석 트리 구조를 모두 사용할 수 있습니다. 그러나 분류 작업에 이러한 …

4
머신 러닝 알고리즘 학습 : 이해 수준과 알고리즘 수
최근에 나는 데이터 과학 분야 (약 6 개월)를 소개 받았으며, Andrew Ng의 머신 러닝 과정과 JHU의 데이터 과학 전문 분야에 대한 연구를 시작했습니다. 실질적인 응용 분야에서 저는 마모를 예측하는 예측 모델을 작성하는 작업을 진행했습니다. 지금까지 이러한 방법을 배우고 적용하기 위해 glm, bayesglm, rf를 사용했지만 이러한 알고리즘을 이해하는 데 많은 차이가 …

5
드롭 아웃이 모델에서 일부 뉴런을 억제한다는 점에서 드롭 아웃 레이어를 추가하면 딥 / 머신 러닝 성능이 개선되는 이유는 무엇입니까?
일부 뉴런을 제거하면 더 나은 성능의 모델이 생성되는 경우, 처음에는 더 적은 수의 뉴런과 더 적은 뉴런으로 더 단순한 신경망을 사용하지 않겠습니까? 처음에 더 크고 복잡한 모델을 만들고 나중에 그 일부를 억제하는 이유는 무엇입니까?



4
word2vec 모델을 훈련하는 동안 전이 학습을 이용할 수 있습니까?
Google 뉴스 데이터 와 같이 이미 훈련 된 모델의 사전 훈련 된 가중치를 찾고 있습니다 . 충분한 양 (10GB 등)의 데이터로 새로운 모델을 훈련하는 것이 어렵다는 것을 알게되었습니다. 따라서 사전 학습 된 레이어 가중치를 얻고 도메인 별 단어에서 해당 가중치를 재교육 할 수있는 전송 학습의 이점을 원합니다. 따라서 교육에 소요되는 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.