«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.



2
닫힌 형태 대 경사 하강에서의 회귀 모수 해결
Andrew Ng의 기계 학습 과정 에서 선형 회귀 및 로지스틱 회귀를 소개하고 경사 하강 및 뉴턴의 방법을 사용하여 모형 매개 변수를 맞추는 방법을 보여줍니다. 그래디언트 디센트는 기계 학습의 일부 응용 프로그램 (예 : 역 전파)에 유용 할 수 있지만 더 일반적인 경우 닫힌 형태의 매개 변수를 풀지 못하는 이유가 있습니다. …

8
머신 러닝에서 찾기 어려운 기술?
데이터 마이닝과 머신 러닝이 대중화되어 거의 모든 CS 학생이 분류 자, 클러스터링, 통계적 NLP 등에 대해 알고있는 것 같습니다. 따라서 오늘날 데이터 마이너를 찾는 것은 어려운 일이 아닙니다. 내 질문은 : 데이터 마이너가 다른 사람들과 차별화 할 수있는 기술은 무엇입니까? 그를 찾기 쉽지 않은 사람 같은 사람으로 만드는 것.

9
시계열에서 이상을 탐지하기 위해 어떤 알고리즘을 사용해야합니까?
배경 Network Operations Center에서 일하고 있으며 컴퓨터 시스템 및 성능을 모니터링합니다. 모니터링 할 주요 지표 중 하나는 현재 서버에 연결된 많은 방문자 / 고객입니다. 이를 보이기 위해 (Ops 팀) 시계열 데이터와 같은 메트릭을 수집하고 그래프를 그립니다. Graphite 는 우리가 그것을 할 수있게 해줍니다.이 API는 갑작스런 하락 (주로) 및 기타 변경이 …

1
교차 검증, 학습 곡선 및 최종 평가를 위해 데이터 세트를 분할하는 방법은 무엇입니까?
데이터 세트를 분할하기위한 적절한 전략은 무엇입니까? 나는 다음과 같은 접근 방식에 대한 피드백을 요청 (안 같은 개별 매개 변수에 대한 test_size또는 n_iter,하지만 내가 사용하는 경우 X, y, X_train, y_train, X_test, 그리고 y_test적절하고 순서가 의미가있는 경우) : ( scikit-learn 문서 에서이 예제를 확장 ) 1. 데이터 셋로드 from sklearn.datasets import load_digits …


6
2016 년에 실제로 필요한 예측 모델링을위한 변수 선택?
이 질문은 몇 년 전 CV에서 1) 훨씬 더 나은 컴퓨팅 기술 (예 : 병렬 컴퓨팅, HPC 등) 및 2) 새로운 기술 (예 : [3])을 고려하여 다시 게시 할 가치가있는 것으로 보입니다. 먼저, 어떤 맥락. 목표가 가설 검정이 아니라 효과 추정이 아니라 보이지 않는 검정 세트에 대한 예측이라고 가정합시다. 따라서 …

3
시계열 분석에 반복 신경망을 사용하는 올바른 방법
재발 신경망은 "메모리"계층을 가지고 있다는 점에서 "정규"네트워크와 다릅니다. 이 계층으로 인해 반복 NN은 시계열 모델링에 유용합니다. 그러나 사용법을 올바르게 이해하고 있는지 잘 모르겠습니다. :의은 (왼쪽에서 오른쪽으로) 나는 다음과 같은 시계열 있다고 가정 해 봅시다 [0, 1, 2, 3, 4, 5, 6, 7], 내 목표는 예측하는 것입니다 i포인트를 사용하여 번째 지점을 …

4
PCA에서 가우시안 커널을 그렇게 마술처럼 만드는 이유는 무엇입니까?
가우시안 및 다항식 커널로 커널 PCA ( 1 , 2 , 3 ) 에 대해 읽었습니다 . 가우시안 커널은 겉보기에 비선형 데이터를 어떻게 잘 분리합니까? 가능한 경우 수학적으로 관련된 분석뿐만 아니라 직관적 인 분석을 제공하십시오. 다른 커널에는없는 가우스 커널 (이상적인 σσ\sigma ) 의 속성은 무엇입니까 ? 신경망, SVM 및 RBF …

3
신경망과 딥 믿음 네트워크의 차이점은 무엇입니까?
사람들이 '깊은 믿음'네트워크를 언급 할 때 이것이 기본적으로 신경망이지만 매우 크다는 인상을 받고 있습니다. 이것이 정확합니까? 아니면 믿음 네트워크가 알고리즘 자체가 다르다는 것을 의미합니까 (즉, 피드 포워드 신경망은 없지만 피드백 루프가있는 것)?


2
왜 세 개의 파티션입니까? (훈련, 검증, 테스트)
모델을 대규모 데이터 세트에 맞추려고 할 때 일반적인 조언은 데이터를 교육, 검증 및 테스트 데이터 세트의 세 부분으로 분할하는 것입니다. 이는 일반적으로 모델에 세 가지 "수준"매개 변수가 있기 때문입니다. 첫 번째 "매개 변수"는 모델 클래스 (예 : SVM, 신경망, 임의 포리스트)이고 두 번째 매개 변수 세트는 "규정 화"매개 변수 또는 …

9
정규화 및 기능 확장은 어떻게, 왜 작동합니까?
많은 기계 학습 알고리즘이 평균 취소 및 공분산 이퀄라이제이션으로 더 잘 작동한다는 것을 알았습니다. 예를 들어 신경망은 더 빨리 수렴하는 경향이 있으며 K-Means는 일반적으로 사전 처리 된 기능으로 더 나은 클러스터링을 제공합니다. 이러한 사전 처리 단계의 직관이 성능 향상으로 이어지지는 않습니다. 누군가 나에게 이것을 설명 할 수 있습니까?

8
테스트 데이터가 교육 데이터로 누출되지 않도록하려면 어떻게해야합니까?
예측 모델을 구축하는 사람이 있지만 적절한 통계 또는 기계 학습 원칙에 정통한 사람이 아니라고 가정합니다. 어쩌면 우리는 그 사람이 배우면서 도움을 줄 수도 있고, 또는 그 사람이 최소한의 지식이 필요한 소프트웨어 패키지를 사용하고있을 수도 있습니다. 이제이 사람은 실제 테스트가 샘플 외부 데이터 의 정확도 (또는 다른 메트릭)에서 온 것임을 잘 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.