데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

1
Keras를 사용하여 딥 러닝을위한 데이터 재구성
Keras의 초보자이며 라이브러리가 실제로 어떻게 작동하는지 이해하기 위해 MNIST 예제로 시작했습니다. Keras 예제 폴더에서 MNIST 문제의 코드 스 니펫은 다음과 같습니다. import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, Flatten from keras.layers import Convolution2D, MaxPooling2D from …

3
언제 데이터 셋을 불균형으로 간주해야합니까?
데이터 세트의 긍정적 및 부정적 예의 수가 불균형 인 상황에 직면하고 있습니다. 내 질문은 데이터 집합에서 일종의 균형을 맞추기 위해 큰 범주를 하위 샘플링 해야하는시기를 알려주는 경험 법칙이 있습니까? 예 : 긍정적 인 예의 수가 1,000이고 부정적인 예의 수가 10,000이면, 전체 데이터 세트에 대한 분류기를 훈련해야합니까, 아니면 부정적인 예를 서브 …

5
기계 학습의 차원 호핑
머신 러닝 (컨볼 루션 신경망 및 이미지 인식에서 발생)의 차원 호핑 문제는 무엇입니까? 나는 그것에 대해 봤지만 재료 모양 변형의 물리학에 관한 정보 만 얻었습니다. 기계 학습과 관련된 예를 통해 설명하면 더 도움이 될 것입니다. 누구 든지이 문제를 해결하거나 나를 도울 수있는 리소스를 가리킬 수 있습니까?

2
파이썬 머신 러닝 / 데이터 과학 프로젝트 구조
Python Machine Learning 프로젝트를 구성하는 방법에 대한 정보를 찾고 있습니다. 파이썬의 일반적인 프로젝트에는 Cookiecutter 와 R ProjectTemplate이 있습니다. 이것은 현재 폴더 구조이지만 Jupyter Notebook을 실제 Python 코드와 혼합하고 있으며 명확하지 않습니다. . ├── cache ├── data ├── my_module ├── logs ├── notebooks ├── scripts ├── snippets └── tools 나는 scripts …
10 python 

2
SQL 테이블에서 자동 이상 탐지 도구?
본질적으로 로그 인 큰 SQL 테이블이 있습니다. 데이터는 매우 복잡하며 모든 데이터를 이해하지 않고 이상을 식별하는 방법을 찾으려고합니다. 이상 탐지를위한 많은 도구를 찾았지만 대부분 "중간자"(예 : Elastic Search, Splunk 등)가 필요합니다. 누구나 기준을 세우고 이상 징후를 자동으로 알려주는 SQL 테이블에 대해 실행할 수있는 도구를 알고 있습니까? 이것은 게으른 것처럼 들릴 …

3
Bayes 네트워크의 가장자리 방향이 관련이 없습니까?
오늘 강의에서 Bayes 네트워크의 가장자리 방향은 실제로 중요하지 않다고 주장했습니다. 인과 관계를 나타내지 않아도됩니다. Bayes 네트워크에서는 단일 에지를 전환 할 수 없습니다. 예를 들어 보자 와 및 . 당신이 전환 할 경우 에 , 다음 더 이상 따라서가 아니라 베이 즈 네트워크 비순환 수 없으며 것이다. 이것은 확률을 추정하는 방법이 …

2
ggvis 대 ggplot2 + Shiny; 대화 형 시각화를 위해 어느 것을 선택해야합니까?
CrossValidated에도 비슷한 질문이 있으며 답변을 읽었습니다. 내 질문은 조금 다릅니다. 나는 단순히 내 데이터를 시각화하고 싶지 않으며 실제로 시각화하려는 것은 두 패키지로 시각화하기가 쉽지 않습니다. 플롯에 두 개의 점 세트 ( 좌표)가 있습니다. 가장자리를 추가하고 그래프와 비슷하게 만들고 싶습니다. n 점이 있으면 문제의 본질에 따라 플롯 에 ( n / …

2
문제 공간이 너무 클 때 AI의 행동을 배우는 방법
나는 실험과 모범을 통해 가장 잘 배웁니다. 나는 신경망에 대해 배우고 있으며 (내 생각에는) 분류와 회귀에 대한 이해력이 뛰어나고 감독되고 감독되지 않은 학습이지만, 나는 조용히 파악할 수없는 무언가를 발견했습니다. 복잡한 게임을하도록 AI를 훈련시키고 싶었다면; RTS와 같은 것을 생각하고 있습니다 (예 : Age of Empires, Empire Earth 등). 이러한 유형의 게임에는 …

1
Hartigan-Wong k-means 방법 및 기타 알고리즘의 수렴
나는 주로 언어 stats패키지로 구현되는 다른 k- 평균 군집 알고리즘을 이해하려고 노력했다 R. Lloyd의 알고리즘과 MacQueen의 온라인 알고리즘을 이해합니다. 내가 이해하는 방법은 다음과 같습니다. 로이드의 알고리즘 : 처음에는 'k'군집의 중심으로 작용할 'k'임의 관측치가 선택됩니다. 그런 다음 중심이 수렴 할 때까지 다음 단계가 반복됩니다. 각 관측치와 선택된 중심 사이의 유클리드 거리가 …
10 r  clustering  k-means 

2
R의 데이터 과학을위한 소프트웨어 테스트
파이썬 코드를 테스트 할 때, 특히 다른 모듈이나 다른 코드와 통합해야 할 때 종종 코, 톡스 또는 단위 테스트를 사용합니다. 그러나 이제 ML 모델링 및 개발에 파이썬보다 R을 더 많이 사용했습니다. 나는 실제로 R 코드를 테스트하지 않는다는 것을 깨달았습니다 (더 중요한 것은 실제로 어떻게 잘하는지 모르겠습니다). 그래서 제 질문은 파이썬에서 …

1
머신 러닝을 이용한 서버 로그 분석
이 작업에는 예외 로그, 데이터베이스 로그 이벤트 로그 등이 포함 된 응용 프로그램의 서버 로그를 분석하기 위해 할당되었습니다. 기계 학습에 익숙하지 않은 탄력적 검색 및 Sparks MLlib (또는 PredictionIO)와 함께 Spark를 사용합니다. 결과적으로 수집 된 예외 로그를 ​​기반으로 예측하여 다음 예외를 유발할 가능성이 높은 사용자와 기능 (및 추적을 유지하고 응용 …

1
텍스트 분류 문제 : Word2Vec / NN이 최선의 방법입니까?
텍스트 단락을 제공하여 시스템을 분류하고 컨텍스트를 식별 할 수있는 시스템을 설계하려고합니다. 사용자 생성 텍스트 단락 (댓글 / 질문 / 응답 등)으로 훈련 트레이닝 세트의 각 항목은로 태그됩니다. 예를 들어 ( "카테고리 1", "텍스트 단락") 수백 가지 범주가 있습니다 그러한 시스템을 구축하는 가장 좋은 방법은 무엇입니까? 몇 가지 다른 옵션을 살펴본 …

5
R 용 LSTM 또는 기타 RNN 패키지
텍스트와 같은 셰익스피어를 생산하는 LSTM 모델에서 인상적인 결과를 보았습니다. R에 LSTM 패키지가 존재하는지 궁금합니다 .Google에서 검색했지만 Python 및 Julia에 대한 패키지 만 찾았습니다. (이러한 프로그램이 R보다 선호되는 이유를 설명하는 성능 문제가있을 수 있습니다.) R의 LSTM (또는 최소한 RNN) 패키지에 대해 알고 있습니까? 존재하는 경우 사용하기위한 자습서가 있습니까?
10 r  neural-network  rnn 

1
자동 엔코더 변환
방금 자동 인코더 변환에 관한 Geoff Hinton의 논문을 읽었습니다. Hinton, Krizhevsky 및 Wang : 자동 인코더 변환 . 인공 신경 네트워크 및 기계 학습에서, 2011. 이런 식으로 장난하고 싶습니다. 그러나 그것을 읽은 후에는 실제로 그것을 구현할 수있는 방법에 대한 논문에서 충분한 세부 정보를 얻을 수 없었습니다. 입력 픽셀과 캡슐 간의 …

2
협동 강화 학습
이미 수익 극대화를 목표로 동적 가격 책정 문제를 해결하는 단일 에이전트에 대해 기능적인 구현이 있습니다. 그러나 내가 함께 일하고있는 문제는 서로를 대체하는 여러 가지 다른 제품과 관련이 있으므로 독립적 인 학습자에게 모두 동적으로 가격을 책정하는 것은 하나의 가격이 다른 사람의 보상에 영향을 미치기 때문에 올바르지 않은 것 같습니다. 목표는 각 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.