데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

4
이것이 기능 엔지니어링의 모범 사례입니까?
기능 공학에 대한 실질적인 질문이 있습니다 ... 로지스틱 회귀를 사용하여 주택 가격을 예측하고 우편 번호를 포함하여 많은 기능을 사용했다고 가정합니다. 그런 다음 기능의 중요성을 확인하여 zip이 꽤 좋은 기능이라는 것을 알고 있으므로 zip을 기반으로 기능을 추가하기로 결정했습니다. 예를 들어 인구 조사국에 가서 평균 수입, 인구, 학교 수 및 수를 얻습니다. …

1
AlphaGo Zero의 "신규 강화 학습 알고리즘"은 무엇입니까?
어떤 이유로 든 AlphaGo Zero는 놀라운 결과에도 불구하고 Original AlphaGo만큼 많은 홍보를 얻지 못했습니다. 처음부터 시작하여 이미 AlphaGo Master를 이겼으며 수많은 다른 벤치 마크를 통과했습니다. 훨씬 더 믿을 수없이 40 일 만에이 작업이 완료됩니다. 구글은이를 "세계 최고의 Go 플레이어"라고 지었다 . DeepMind는 이것이 "새로운 형태의 강화 학습"이라고 주장합니다.이 기법은 참신한가요? …

1
1D 시계열이있는 Keras LSTM
Keras 사용법을 배우고 있으며 Chollet 's Deep Learning for Python 의 예제를 사용하여 레이블이 지정된 데이터 세트로 합리적인 성공을 거두었습니다 . 데이터 세트는 3 개의 잠재적 클래스를 가진 길이가 3125 인 ~ 1000 시계열입니다. 70 %의 예측률을 제공 하는 기본 Dense 레이어를 넘어서서이 책에서 LSTM 및 RNN 레이어에 대해 논의하려고합니다. …

2
TensorFlow를 사용하여 재무 시계열 데이터 예측
ML과 TensorFlow를 처음 사용하고 (약 몇 시간 전에 시작) 시계열에서 다음 몇 가지 데이터 요소를 예측하는 데 사용하려고합니다. 나는 입력을 받고 이것을 사용하여 이것을하고있다 : /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | '-------------------------------' \----------- y ------------/ …

2
GPU에서 교육이 오래 걸리는 이유는 무엇입니까?
세부: GPU : GTX 1080 훈련 : 10 개 수업에 속하는 ~ 1.1 백만개의 이미지 유효성 검사 : 10 개의 클래스에 속하는 ~ 150 개의 이미지 에포크 당 시간 : ~ 10 시간 CUDA, cuDNN 및 Tensorflow (Tensorflow GPU도)를 설정했습니다. 나는 내 모델이 에포크 당 10 시간이 걸리는 복잡한 것이라고 …

2
죽은 relu 뉴런을 확인하는 방법
배경 : relu 활성화로 신경망을 맞추는 동안 때로는 예측이 거의 일정하다는 것을 알았습니다. 나는 이것이 여기에 언급 된 훈련 중 죽는 relu 뉴런 때문이라고 생각합니다. ( 신경망에서 "dying ReLU"문제는 무엇입니까? ) 질문 : 코드 자체에서 뉴런이 죽었는지 확인하기 위해 검사를 구현하는 것이 좋습니다. 그 후, 코드는 필요한 경우 네트워크에 맞출 …

3
임의의 수의 입력 및 출력을 가진 인공 신경 네트워크 (ANN)
내 문제에 ANN을 사용하고 싶지만 문제는 입력 및 출력 노드 번호가 수정되지 않은 것입니다. 내 질문을하기 전에 구글 검색을했는데 RNN이 내 문제에 도움이 될 수 있음을 발견했습니다. 그러나 내가 찾은 모든 예제는 어떻게 든 입력 및 출력 노드를 정의했습니다 . 그래서 전략을 찾고 있는데, Keras 또는 PyTorch에서 선호하는 전략을 현실화하거나 …

3
EEG 데이터에 대한 반복 (CNN) 모델
EEG 컨텍스트에서 반복 아키텍처를 해석하는 방법이 궁금합니다. 특히 이것을 LSTM과 같은 아키텍처와 달리 Recurrent CNN이라고 생각하지만 다른 유형의 반복 네트워크에도 적용될 수 있습니다. R-CNN에 대해 읽으면 일반적으로 이미지 분류 컨텍스트에서 설명됩니다. 일반적으로 "시간에 따른 학습"또는 "현재 입력에 대한 시간 -1의 영향 포함"으로 설명됩니다. 이 해석 / 설명은 EEG 데이터로 작업 …

1
DropOut은 컨볼 루션 레이어와 정확히 어떻게 작동합니까?
드롭 아웃 ( paper , description )은 일부 뉴런의 출력을 0으로 설정합니다. 따라서 MLP의 경우 아이리스 플라워 데이터 세트에 대해 다음 아키텍처를 가질 수 있습니다 . 4 : 50 (tanh) : dropout (0.5) : 20 (tanh) : 3 (softmax) 다음과 같이 작동합니다. s o ft m a x ( W삼⋅ …
10 dropout 


1
Spark ALS : 신규 사용자에게 권장
질문 Spark 교육을받은 ALS 모델에서 신규 사용자의 등급을 어떻게 예측합니까? (신규 = 훈련 시간 동안 보이지 않음) 문제 공식 Spark ALS 튜토리얼을 따르고 있습니다. http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html 괜찮은 MSE로 좋은 추천자를 만들 수는 있지만 모델에 새 데이터를 입력하는 방법에 어려움을 겪고 있습니다. 튜토리얼은 교육 전에 첫 번째 사용자의 등급을 변경하지만 이것은 실제로 …

1
Keras에서 모델 병합의 중요성은 무엇입니까?
Keras에는 다음에 따라 두 모델을 "병합"하는 기능이 있다는 것을 알게되었습니다. from keras.layers import Merge left_branch = Sequential() left_branch.add(Dense(32, input_dim=784)) right_branch = Sequential() right_branch.add(Dense(32, input_dim=784)) merged = Merge([left_branch, right_branch], mode='concat') 머천트 NN의 요점은 무엇이며 어떤 상황에서 유용합니까? 일종의 앙상블 모델링입니까? 성능 측면에서 여러 "모드"(concat, avg, dot 등)의 차이점은 무엇입니까?
10 keras 

4
기능 선택 및 분류 정확도 관계
분류 자에 대해 사용 가능한 기능의 하위 집합을 선택하는 방법 중 하나는 기준 (예 : 정보 획득)에 따라 해당 기능의 순위를 지정한 다음 분류 자와 순위가 지정된 기능의 하위 집합을 사용하여 정확도를 계산하는 것입니다. 당신의 특징은 예를 들어, A, B, C, D, E그들은 다음과 같이 평가하는 경우, 그리고 D,B,C,E,A, 당신은 …

4
자주 구매하는 품목 시각화
CSV 파일에 다음 구조의 데이터 세트가 삽입되어 있습니다. Banana Water Rice Rice Water Bread Banana Juice 각 행은 함께 구매 한 품목의 모음을 나타냅니다. 예를 들어, 첫 번째 행은 항목 것을 나타내고 Banana, Water와 Rice함께 구입 하였다. 다음과 같은 시각화를 만들고 싶습니다. 이것은 기본적으로 그리드 차트이지만 입력 구조를 읽고 위와 …

3
Word2Vec과 Doc2Vec은 모두 분산 표현입니까 아니면 분산 표현입니까?
분포 표현은 유사한 맥락에서 발생하는 단어가 유사한 의미를 갖는 경향이 있다는 분포 가설을 기반으로한다는 것을 읽었습니다. Word2Vec과 Doc2Vec은 모두이 가설에 따라 모델링됩니다. 그러나, 원래의 논문에서, 심지어는 같은 제목되는 Distributed representation of words and phrases과 Distributed representation of sentences and documents. 따라서 이러한 알고리즘은 분포 표현 또는 분산 표현을 기반으로합니다. LDA …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.