«python» 태그된 질문

프로그래밍 언어 Python과 관련된 데이터 과학 질문에 사용합니다. 일반적인 코딩 질문 (-> stackoverflow)을위한 것은 아닙니다.

2
TensorFlow를 사용하여 재무 시계열 데이터 예측
ML과 TensorFlow를 처음 사용하고 (약 몇 시간 전에 시작) 시계열에서 다음 몇 가지 데이터 요소를 예측하는 데 사용하려고합니다. 나는 입력을 받고 이것을 사용하여 이것을하고있다 : /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | '-------------------------------' \----------- y ------------/ …

2
GPU에서 교육이 오래 걸리는 이유는 무엇입니까?
세부: GPU : GTX 1080 훈련 : 10 개 수업에 속하는 ~ 1.1 백만개의 이미지 유효성 검사 : 10 개의 클래스에 속하는 ~ 150 개의 이미지 에포크 당 시간 : ~ 10 시간 CUDA, cuDNN 및 Tensorflow (Tensorflow GPU도)를 설정했습니다. 나는 내 모델이 에포크 당 10 시간이 걸리는 복잡한 것이라고 …

3
임의의 수의 입력 및 출력을 가진 인공 신경 네트워크 (ANN)
내 문제에 ANN을 사용하고 싶지만 문제는 입력 및 출력 노드 번호가 수정되지 않은 것입니다. 내 질문을하기 전에 구글 검색을했는데 RNN이 내 문제에 도움이 될 수 있음을 발견했습니다. 그러나 내가 찾은 모든 예제는 어떻게 든 입력 및 출력 노드를 정의했습니다 . 그래서 전략을 찾고 있는데, Keras 또는 PyTorch에서 선호하는 전략을 현실화하거나 …

4
자주 구매하는 품목 시각화
CSV 파일에 다음 구조의 데이터 세트가 삽입되어 있습니다. Banana Water Rice Rice Water Bread Banana Juice 각 행은 함께 구매 한 품목의 모음을 나타냅니다. 예를 들어, 첫 번째 행은 항목 것을 나타내고 Banana, Water와 Rice함께 구입 하였다. 다음과 같은 시각화를 만들고 싶습니다. 이것은 기본적으로 그리드 차트이지만 입력 구조를 읽고 위와 …

1
Keras를 사용하여 딥 러닝을위한 데이터 재구성
Keras의 초보자이며 라이브러리가 실제로 어떻게 작동하는지 이해하기 위해 MNIST 예제로 시작했습니다. Keras 예제 폴더에서 MNIST 문제의 코드 스 니펫은 다음과 같습니다. import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, Flatten from keras.layers import Convolution2D, MaxPooling2D from …

2
파이썬 머신 러닝 / 데이터 과학 프로젝트 구조
Python Machine Learning 프로젝트를 구성하는 방법에 대한 정보를 찾고 있습니다. 파이썬의 일반적인 프로젝트에는 Cookiecutter 와 R ProjectTemplate이 있습니다. 이것은 현재 폴더 구조이지만 Jupyter Notebook을 실제 Python 코드와 혼합하고 있으며 명확하지 않습니다. . ├── cache ├── data ├── my_module ├── logs ├── notebooks ├── scripts ├── snippets └── tools 나는 scripts …
10 python 


4
imdb 웹 페이지를 긁는 방법?
데이터 분석을 배우기위한 노력의 일환으로 Python을 사용하여 웹 스크랩 핑을 배우려고합니다. URL이 다음과 같은 imdb 웹 페이지를 긁으려고합니다. http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=feature&year=1950,2012 BeautifulSoup 모듈을 사용하고 있습니다. 다음은 사용중인 코드입니다. r = requests.get(url) # where url is the above url bs = BeautifulSoup(r.text) for movie in bs.findAll('td','title'): title = movie.find('a').contents[0] genres = movie.find('span','genre').findAll('a') genres …

2
많은 기능으로 로지스틱 회귀를 수행하는 방법은 무엇입니까?
로지스틱 회귀에 대한 이진 클래스 문제가있는 각 샘플에 대해 330 개의 샘플과 27 개의 기능이있는 데이터 세트가 있습니다. "10이면 규칙"에 따르면 각 기능을 포함하려면 최소한 10 개의 이벤트가 필요합니다. 그럼에도 불구하고 나는 긍정적 인 클래스 20 %와 부정적인 클래스 80 %의 불균형 데이터 세트를 가지고 있습니다. 이로 인해 70 개의 …


1
다른 파이썬 커널간에 DataFrame을 다시로드하지 마십시오.
변수 (큰 테이블 / 데이터 프레임)를 메모리에 유지하고 여러 ipython 노트북에서 공유하는 방법이 있습니까? MATLAB의 지속적 변수와 개념적으로 유사한 것을 찾고 있습니다. 여러 개별 편집기 (노트북)에서 사용자 정의 함수 / 라이브러리를 호출하고 해당 외부 함수가 일부 결과 (또는 큰 테이블)를 캐시 할 수 있습니다. 주로 새로운 분석을 시작할 때마다 약 …

3
파이썬에서 동일한 값을 그룹화하고 빈도를 계산하는 방법은 무엇입니까?
파이썬으로 분석하는 초보자이므로 조심하십시오. 소매점에 대한 거래 데이터의 데이터 집합이 있습니다. 설명과 함께 변수는 다음과 같습니다. 섹션 : 상점의 섹션, str; prod_name : 제품 이름, str; 영수증 : 송장 번호, int; 출납원, 출납원 수, 정수; 비용 : 품목의 비용, 플로트; 날짜는 MM / DD / YY 형식으로 str입니다. HH : …

3
환경 데이터를 기반으로 작물 수확량을 예측하기위한 기계 학습 모델 구축
10 년 동안 농장의 온도, 강수량 및 콩 수확량에 대한 데이터가 포함 된 데이터 세트가 있습니다 (2005-2014). 이 데이터를 바탕으로 2015 년의 수익률을 예측하고 싶습니다. 작물 수확은 작물 재배시기가 끝날 때 발생하기 때문에 데이터 세트에는 온도 및 강수량에 대한 일일 값이 있지만 수확량에 대해 연간 1 개의 값만 있습니다. 지난 …


2
scikit 분류 기준을 분류하는 데 시간이 얼마나 걸립니까?
1 백만 개의 레이블이 지정된 문서로 구성된 모음에서 텍스트 분류를 위해 scikit 선형 지원 벡터 머신 (SVM) 분류기를 사용할 계획입니다. 내가 할 계획은 사용자가 키워드를 입력하면 분류자가 먼저 범주별로 분류 한 다음 해당 범주 범주의 문서 내에서 후속 정보 검색 쿼리가 발생한다는 것입니다. 몇 가지 질문이 있습니다. 분류에 많은 시간이 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.