«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.

8
클러스터링 지리적 위치 좌표 (lat, long pairs)
지리적 위치 클러스터링에 대한 올바른 접근 방법 및 클러스터링 알고리즘은 무엇입니까? 다음 코드를 사용하여 지리적 위치 좌표를 클러스터링합니다. import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], …

8
기계 학습에서 과적 합이 나쁜 이유는 무엇입니까?
논리는 종종 모델을 과적 합함으로써 일반화 할 수있는 능력이 제한적이라고 말하지만, 이는 과적 합이 특정 복잡성 이후에 모델이 개선되는 것을 막을 수 있음을 의미 할 수도 있습니다. 과적 합은 데이터의 복잡성에 관계없이 모델을 악화시키는 원인이됩니까? 그렇다면 왜 그런가? 관련 : 위의 질문에 대한 후속 조치 , " 모델은 언제 적합하지 …

4
신경망 : 어느 비용 함수를 사용해야합니까?
주로 신경망을 이용한 실험에 TensorFlow 를 사용하고 있습니다. 지금은 꽤 많은 실험 (XOR-Problem, MNIST, 일부 회귀 분석 등)을 수행했지만 전체적으로 초보자로 간주 될 수 있기 때문에 특정 문제에 대해 "정확한"비용 함수를 선택하는 데 어려움을 겪고 있습니다. TensorFlow에 오기 전에 파이썬 과 NumPy를 사용 하여 완전히 연결된 MLP와 일부 반복 네트워크를 …


5
'균형'데이터 세트 또는 '대표'데이터 세트를 사용해야합니까?
나의 '머신 러닝'과제는 양성 인터넷 트래픽과 악성 트래픽을 분리하는 것입니다. 실제 시나리오에서 인터넷 트래픽의 대부분 (예 : 90 % 이상)은 양성입니다. 따라서 모델 훈련을 위해 유사한 데이터 설정을 선택해야한다고 생각했습니다. 그러나 나는 모델을 훈련시키기 위해 "클래스 밸런싱"데이터 접근 방식을 사용하여 양성 및 악성 트래픽의 동일한 수의 인스턴스를 암시하는 연구 논문을 …


4
시계열 모델 LSTM에 기능 추가
LSTM과 시계열에 대한 사용법에 대해 조금 읽었으며 흥미롭지 만 동시에 어려웠습니다. 내가 이해하는 데 어려움을 겪었던 한 가지는 이미 시계열 기능 목록에 추가 기능을 추가하는 방법입니다. 다음과 같이 데이터 세트가 있다고 가정하십시오. t-3, t-2, t-1, 출력 이제 출력에 영향을주는 기능이 있지만 반드시 시계열 기능은 아니라는 사실을 알고 날씨 외부의 날씨를 …

4
모든 교육 데이터가 포함 된 단일 "일괄 처리"보다 미니 배치 크기가 더 좋은 이유는 무엇입니까?
딥 러닝 모델의 경우 일반적인 연습은 여러 교육 시대에 미니 배치 (일반적으로 작은 32/64)를 적용하는 것입니다. 나는 이것의 이유를 실제로 추측 할 수 없다. 내가 실수하지 않는 한 배치 크기는 훈련 반복 중에 모델에서 볼 수있는 훈련 인스턴스의 수입니다. 에포크는 각 훈련 사례가 모델에 의해 보여 졌을 때 완전한 회전입니다. …

10
머신 러닝 모델을 블랙 박스라고하는 이유는 무엇입니까?
필자는이 블로그 게시물을 읽었습니다. The Financial World는 AI의 블랙 박스를 열고 싶어 합니다. 저자는 ML 모델을 "블랙 박스"라고 반복해서 말합니다. ML 모델을 언급 할 때 유사한 용어가 여러 곳에서 사용되었습니다. 왜 그래야만하지? ML 엔지니어가 신경망 내부에서 무슨 일이 일어나고 있는지 알지 못하는 것은 아닙니다. ML 엔지니어는 사용할 활성화 기능, 해당 …

11
C (또는 C ++)의 데이터 과학
저는 R언어 프로그래머입니다. 나는 또한 데이터 과학자로 간주되지만 CS 이외의 학문 분야에서 온 사람들의 그룹에 있습니다. 이것은 데이터 과학자로서의 역할에서 잘 작동하지만 R다른 스크립팅 / 웹 언어에 대한 기본 지식 만 가지고 경력을 시작함으로써 두 가지 주요 영역에서 다소 부적절하다고 느꼈습니다. 프로그래밍 이론에 대한 확실한 지식이 부족합니다. 경쟁과 같은보다 빠르고 …

10
기계 학습 알고리즘이 스포츠 점수 또는 경기를 예측할 수 있습니까?
나는 좋은 N- 프로젝트를 만들 것으로 생각되는 다양한 NFL 데이터 세트를 가지고 있지만 아직 아무것도하지 않았습니다. 이 사이트를 방문하면 기계 학습 알고리즘을 생각하게되었고 축구 경기의 결과를 예측하거나 다음 경기에서 얼마나 좋은지 궁금합니다. 3 위와 1 위에서 이론상으로 강한 런백을 한 팀 은 그러한 상황에서 볼을 돌리는 경향이 있어야 할 것으로 …

3
사용시기-기계 학습 [폐쇄]
최근 UPC / Barcelona의 Oriol Pujol 교수의 기계 학습 수업에서 그는 광범위한 기계 학습 관련 작업에 사용할 가장 일반적인 알고리즘, 원리 및 개념을 설명했습니다. 여기서 나는 당신과 그것들을 공유하고 당신에게 묻습니다. 다양한 유형의 기계 학습 관련 문제와 관련된 접근 방식 또는 방법과 포괄적 인 프레임 워크 일치 작업이 있습니까? 간단한 …


2
XGBoost 중요성의 결과를 해석하는 방법은 무엇입니까?
xgboost 모델을 실행했습니다. 의 출력을 해석하는 방법을 정확히 모르겠습니다 xgb.importance. 게인, 커버 및 주파수의 의미는 무엇이며 어떻게 해석합니까? 또한 Split, RealCover 및 RealCover %는 무엇을 의미합니까? 여기에 몇 가지 추가 매개 변수가 있습니다 기능 중요도에 대해 더 자세히 알려주는 다른 매개 변수가 있습니까? R 문서에서 Gain은 Information gain과 비슷하며 Frequency는 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.