«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.


6
교차 엔트로피 손실 설명
분류를 위해 NN을 작성한다고 가정하십시오. 마지막 레이어는 softmax 활성화가있는 밀도가 높은 레이어입니다. 분류 할 5 가지 수업이 있습니다. 하나의 훈련 예를 들어 가정의가 true label있습니다 [1 0 0 0 0]예측 될 때 [0.1 0.5 0.1 0.1 0.2]. 이 예제의 교차 엔트로피 손실을 어떻게 계산합니까?

1
`Keras`의`Dense`와`TimeDistributedDense`의 차이점
난 아직도 사이의 차이에 대해 혼란 스러워요 Dense와 TimeDistributedDense의 Keras이미 이와 유사한 질문도있다하더라도 여기 와 여기 . 사람들은 많이 논의하고 있지만 일반적으로 합의 된 결론은 없습니다. 그리고 비록, 여기 , 밝혔다 @fchollet : TimeDistributedDenseDense3D 텐서의 모든 타임 스텝에 동일한 (완전히 연결된) 작업을 적용합니다 . 나는 여전히 그들 사이의 차이점에 대한 …


5
딥 러닝 vs 그라디언트 부스팅 : 언제 무엇을 사용해야합니까?
큰 데이터 세트에 큰 데이터 문제가 있습니다 (예 : 5 천만 행 및 200 열 사용). 데이터 집합은 약 100 개의 숫자 열과 100 개의 범주 열 및 이진 클래스 문제를 나타내는 응답 열로 구성됩니다. 각 범주 열의 카디널리티는 50보다 작습니다. 딥 러닝 방법 또는 앙상블 트리 기반 방법 (예 …

3
softmax 분류기에서 exp 함수를 사용하여 정규화하는 이유는 무엇입니까?
표준 정규화와 달리 softmax를 사용하는 이유는 무엇입니까? @Kilian Batzner는이 질문에 대한 답변의 의견 영역에서 2 가지 질문을 제기하여 많은 혼란을 겪었습니다. 수치상의 이점을 제외하고는 아무도 설명하지 않는 것 같습니다. Cross-Entropy Loss를 사용하는 이유를 알지만 softmax와 어떤 관련이 있습니까? "softmax 함수는 예측과 진실 사이의 교차 엔트로피를 최소화하려는 것으로 볼 수 있습니다." …

5
강화 학습에서 Q 기능은 무엇이며 V 기능은 무엇입니까?
저 보인다 기능을 용이하게 나타낼 수있다 함수 따라서 함수 나에게 불필요한 것으로 보인다. 그러나, 나는 강화 학습에 익숙하지 않아서 뭔가 잘못되었다고 생각합니다.VVVQQQVVV 정의 Q 및 V 학습은 Markov 의사 결정 프로세스와 관련이 있습니다. MDP는 5 튜플 와(S,A,P,R,γ)(S,A,P,R,γ)(S, A, P, R, \gamma) SSS 는 일련의 상태입니다 (일반적으로 유한) AAA 는 일련의 …

7
머신 러닝 작업을 위해 데이터를 섞어 야하는 이유
머신 러닝 작업에서는 데이터를 섞고 정규화하는 것이 일반적입니다. 정규화의 목적은 분명합니다 (같은 범위의 기능 값을 갖기 위해). 그러나 많은 어려움을 겪은 후 데이터를 섞는 데 중요한 가치를 찾지 못했습니다. 이 게시물 읽게 여기에 우리가 데이터를 셔플해야 할 때 논의를하지만, 우리는 데이터를 셔플해야하는 이유는 명확하지 않다. 또한 배치 그라디언트 디센트가 필요한 …

1
xgboost가 GradientBoostingClassifier를 sklearn보다 훨씬 빠른 이유는 무엇입니까?
100 개의 숫자 기능을 가진 50k 개 이상의 그라디언트 부스팅 모델을 훈련하려고합니다. XGBClassifier동안 내 컴퓨터 43 초 이내에 핸들 (500) 나무, GradientBoostingClassifier핸들 10 나무 (!) 일분 2 초 :( 내가 귀찮게하지 않았다에서 그것은 시간이 걸릴 것으로 500 그루의 나무를 성장하려고합니다. 나는 같은 사용하고 있습니다 learning_rate및 max_depth설정 아래를 참조하십시오. XGBoost를 훨씬 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
불균형이 높은 데이터 세트 교육에 대한 빠른 안내
훈련 세트에서 약 1000 개의 양성 및 10000 개의 음성 샘플로 분류 문제가 있습니다. 따라서이 데이터 세트는 상당히 불균형합니다. 일반 임의 포리스트는 모든 테스트 샘플을 대다수 클래스로 표시하려고합니다. 서브 샘플링 및 가중 임의 숲에 대한 좋은 답변은 여기에 주어집니다 : 높은 바이어스 데이터 세트와 나무 앙상블 훈련의 의미는 무엇인가? RF …

2
진실은 무엇인가
기계 학습 의 맥락에서 , 나는 지상 진실 이라는 용어 가 많이 사용되는 것을 보았습니다 . 나는 많은 것을 검색했고 Wikipedia 에서 다음 정의를 찾았습니다 . 기계 학습에서 "지상 진실"이라는 용어는 감독 학습 기술에 대한 훈련 세트 분류의 정확성을 의미합니다. 이는 연구 가설을 입증하거나 반증하기 위해 통계 모델에서 사용됩니다. "지상 …

4
SVM을 통해 랜덤 포레스트를 사용하는 경우와 그 반대의 경우는 언제입니까?
때 하나 사용하는 것이 Random Forest이상 SVM반대와 반대? 나는 cross-validation모델 비교가 모델 선택의 중요한 측면 이라는 것을 이해 하지만 여기서는 두 가지 방법의 경험 법칙과 경험적 규칙에 대해 더 배우고 싶습니다. 누군가 분류기의 미묘함, 강점 및 약점뿐만 아니라 각각에 가장 적합한 문제를 설명해 주시겠습니까?

4
이력서 데이터를 기반으로 작업 분류를 수행하려면 어떤 알고리즘을 사용해야합니까?
R에서 모든 일을하고 있습니다. 문제는 다음과 같습니다. 기본적으로 이력서 (CV) 목록이 있습니다. 일부 응시자는 이전에 업무 경험이 있고 일부는 그렇지 않습니다. 여기서 목표는 이력서의 텍스트를 기반으로 다른 작업 부문으로 분류하고 싶습니다. 나는 지원자가 경험이없는 학생 / 학생 인 경우에 특히 관심이 있으며, 졸업 후이 지원자가 속하는 직업 분야를 분류하기 위해 …

4
새로운 관측 값을 사용할 수있는 경우 모델을 다시 훈련시켜야합니까?
따라서이 주제에 대한 문헌을 찾을 수 없었지만 생각할 가치가있는 것처럼 보입니다. 새로운 관찰이 가능한 경우 모델 교육 및 최적화에 대한 모범 사례는 무엇입니까? 예측이 저하되기 전에 모델 재 훈련주기 / 빈도를 결정하는 방법이 있습니까? 매개 변수가 집계 된 데이터에 대해 다시 최적화되면 과적 합입니까? 학습이 반드시 온라인 일 필요 는 …

6
모델 하이퍼 파라미터와 모델 파라미터의 차이점은 무엇입니까?
모델 하이퍼 파라미터 및 모델 매개 변수 와 같은 용어는 사전 설명없이 웹에서 상호 교환 적으로 사용되었습니다. 나는 이것이 잘못되었다고 생각하고 설명이 필요합니다. 기계 학습 모델, SVM / NN / NB 기반 분류기 또는 이미지 인식기를 고려하십시오. 모델 의 하이퍼 파라미터 와 파라미터 는 무엇입니까 ? 예를 들어주세요.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.