데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

2
종이 초록을 크롤링하는 API가 있습니까?
매우 긴 종이 이름 목록을 가지고 있다면 인터넷이나 데이터베이스에서이 종이의 초록을 어떻게 얻을 수 있습니까? 논문 이름은 "공공 건강 영역을위한 웹 마이닝 유틸리티 평가"와 같습니다. 아무도 나에게 해결책을 줄 수있는 API를 알고 있습니까? Google 학자를 크롤링하려고했지만 Google이 내 크롤러를 차단했습니다.

2
Keras에서 "일대 다"및 "다 대다"시퀀스 예측을 구현하는 방법은 무엇입니까?
일대 다 (예 : 단일 이미지의 분류) 및 다 대다 (예 : 이미지 시퀀스의 분류) 서열 라벨링에 대한 Keras 코딩 차이를 해석하는 데 어려움을 겪고 있습니다. 두 가지 다른 종류의 코드가 자주 보입니다. 유형 1은 TimeDistributed가 다음과 같이 적용되지 않은 곳입니다. model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) model.add(Convolution2D(nb_filters, …
13 keras  rnn  lstm  sequence 

3
추론에 GPU 또는 CPU를 사용해야합니까?
GPU로 훈련받은 딥 러닝 신경망을 실행하고 있습니다. 이제 추론을 위해 이것을 여러 호스트에 배포하고 싶습니다. 문제는 추론을 위해 GPU 또는 CPU를 사용해야하는지 여부를 결정하는 조건은 무엇입니까? 아래 주석에서 더 자세한 내용을 추가하십시오. 나는 이것에 익숙하지 않으므로 지침에 감사드립니다. 메모리 : GPU는 K80 프레임 워크 : Cuda와 cuDNN 워크로드 당 데이터 …

3
딥 러닝 NN과 현재 (2016)는 4 년 전에 공부 한 (NN)과 어떻게 다른가요?
Wikipedia 와 deeplearning4j 에서 DLNN ( Deep-Learning NN)은 숨겨진 계층이 1보다 큰 NN이라고합니다. 이러한 종류의 NN은 대학에서 표준 이었지만 DLNN은 매우 과장된 것입니다. 거기에 있었습니까? 큰 문제는 무엇입니까? 또한 스택 NN이 딥 러닝으로 간주된다고 들었습니다. 딥 러닝은 실제로 어떻게 정의됩니까? NN에 대한 나의 배경은 대부분 직업이 아닌 대학 출신입니다. 산업에서 …

3
하이퍼 큐브의 대부분의 포인트가 경계에 있다고 말할 때 무엇을 의미합니까?
50 차원 하이퍼 큐브가 있다면. 그리고 경계를 또는 0.95 < x j < 1로 정의합니다. 여기서 x j 는 하이퍼 큐브의 차원입니다. 그런 다음 하이퍼 큐브의 경계에서 점의 비율을 계산하는 것은 0.995 입니다. 무슨 뜻이에요? 나머지 공간이 비어 있다는 의미입니까? 경우 (99) % 포인트의이 경계에있는 다음 큐브 안에 포인트가 균일하게 …

2
Keras의 Early Stopping 콜백에서 사용하는 메트릭을 변경해야합니까?
Keras 교육에서 Early Stopping 콜백을 사용하는 경우 일부 메트릭 (일반적으로 유효성 검증 손실)이 증가하지 않으면 중지됩니다. 검증 손실 대신 다른 측정법 (정밀도, 리콜, f- 측정)을 사용하는 방법이 있습니까? 지금까지 본 모든 예제는 다음과 비슷합니다. 콜백 .EarlyStopping (monitor = 'val_loss', patience = 5, verbose = 0, mode = 'auto')


4
CSV 파일 내용을 pyspark 데이터 프레임으로 가져 오기
.csv 파일을 pyspark 데이터 프레임으로 가져 오려면 어떻게합니까? 팬더에서 CSV 파일을 읽은 다음 createDataFrame을 사용하여 스파크 데이터 프레임으로 변환하려고 시도했지만 여전히 오류가 표시됩니다. 누군가 이것을 통해 나를 안내 할 수 있습니까? 또한 xlsx 파일을 가져 오는 방법을 알려주십시오. CSV 콘텐츠를 팬더 데이터 프레임으로 가져온 다음 스파크 데이터 프레임으로 변환하려고하지만 오류가 …
13 pyspark 


3
자연어 대 SQL 쿼리
"자연 언어를 SQL 쿼리로 변환"시스템을 개발하고 있습니다. 비슷한 질문에 대한 답변을 읽었지만 원하는 정보를 얻을 수 없었습니다. 아래는 알고리즘에서 Arun Solanki의 Garima Singh에 의해 자연어를 관계형 데이터베이스에 대한 SQL 쿼리로 변환하기 위해 얻은 시스템의 순서도입니다. 음성 태그 지정 단계의 일부까지 이해했습니다. 그러나 나머지 단계에 어떻게 접근합니까? 가능한 모든 SQL 쿼리를 …

4
큰 범주 값에 대한 하나의 핫 인코딩 대안?
1600 개가 넘는 범주 값이 큰 데이터 프레임이 있습니다 .1600 개가 넘는 열이 없도록 대안을 찾을 수있는 방법이 있습니까? 나는 재미있는 링크 http://amunategui.github.io/feature-hashing/#sourcecode 아래에서 이것을 발견했다. 그러나 그들은 내가 원하지 않는 클래스 / 객체로 변환하고 있습니다. 다른 머신 러닝 모델로 테스트 할 수 있도록 최종 출력을 데이터 프레임으로 원합니까? 또는 …

5
일반 관계형 데이터베이스에 대한 팬더 데이터 프레임의 장점
데이터 과학에서 많은 사람들이 팬더 데이터 프레임을 데이터 저장소로 사용하는 것 같습니다 . 팬더의 특징은 다른 많은 프로그래밍 분야에 데이터를 저장하는 데 사용되는 MySQL 과 같은 일반적인 관계형 데이터베이스 와 비교하여 우수한 데이터 저장소로 만드는 것 입니까? 팬더는 데이터 탐색에 유용한 기능을 제공하지만 SQL을 사용할 수 없으며 쿼리 최적화 또는 …
13 pandas  databases 

1
다차원 및 다변량 시계열 예측 (RNN / LSTM) Keras
Keras (또는 TensorFlow)를 사용하여 다차원 및 다변량 시계열 예측 을 만들기 위해 데이터를 표현하고 형성하는 방법을 이해하려고 노력 했지만 많은 블로그 게시물 / 자습서 / 문서를 읽은 후에도 여전히 명확하지 않습니다. 올바른 모양 (대부분의 예는 약간 적음) 내 데이터 세트 : 여러 도시 온도, 자동차 교통량, 습도에 대한 정보가 있습니다. …
12 python  keras  rnn  lstm 

1
Keras의 멀티 태스킹 학습
Keras에서 공유 레이어를 구현하려고합니다. Keras에는 keras.layers.concatenate있지만, 사용에 대한 설명서는 확실하지 않습니다. 여러 개의 공유 레이어를 만드는 데 사용할 수 있습니까? Keras를 사용하여 아래에 표시된 것처럼 간단한 공유 신경 네트워크를 구현하는 가장 좋은 방법은 무엇입니까? 3 개의 NN에 대한 모든 입력, 출력 및 공유 레이어의 모양은 동일합니다. 세 개의 NN에는 여러 …

1
LSTM의 장점은 무엇입니까?
Keras 패키지에 대한 지식을 넓히고 있으며 사용 가능한 모델 중 일부를 툴링하고 있습니다. 해결하려는 NLP 이진 분류 문제가 있으며 다른 모델을 적용하고 있습니다. 일부 결과로 작업하고 LSTM에 대해 점점 더 많은 것을 읽은 후에는이 접근법이 내가 시도한 다른 것 (여러 데이터 세트에서)보다 훨씬 우수한 것처럼 보입니다. "왜 LSTM을 사용 하지 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.