데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

4
빅 데이터 사례 연구 또는 사용 사례
다양한 유형의 산업에서 Big Data Analytic을 사용하는 방법에 대한 블로그 / 기사를 많이 읽었습니다. 그러나이 기사의 대부분은 언급하지 않습니다 이 회사들은 어떤 종류의 데이터를 사용 했습니까? 데이터의 크기는 얼마입니까 데이터를 처리하는 데 사용한 도구 기술 그들이 직면 한 문제는 무엇이며 데이터를 얻는 통찰력으로 문제를 해결하는 데 도움이되었습니다. 그들이 자신의 필요에 …

5
드롭 아웃이 모델에서 일부 뉴런을 억제한다는 점에서 드롭 아웃 레이어를 추가하면 딥 / 머신 러닝 성능이 개선되는 이유는 무엇입니까?
일부 뉴런을 제거하면 더 나은 성능의 모델이 생성되는 경우, 처음에는 더 적은 수의 뉴런과 더 적은 뉴런으로 더 단순한 신경망을 사용하지 않겠습니까? 처음에 더 크고 복잡한 모델을 만들고 나중에 그 일부를 억제하는 이유는 무엇입니까?

3
그래프 임베딩이란 무엇입니까?
최근에는 DeepWalk 및 LINE과 같은 그래프 임베딩을 발견했습니다. 그러나 그래프 임베딩의 의미와 사용시기 (응용 프로그램)에 대한 명확한 아이디어가 여전히 있습니까? 어떤 제안이라도 환영합니다!
13 graphs 

3
치수 축소를위한 자동 엔코더가 대칭 인 이유는 무엇입니까?
나는 자동 엔코더 또는 신경망의 전문가가 아니므로 어리석은 질문이라면 용서하십시오. 차원 축소 또는 고차원 데이터에서 클러스터 시각화를 위해 자동 엔코더를 사용하여 2 개의 노드로 네트워크 계층의 출력을 검사하여 (손실) 2 차원 표현을 만들 수 있습니다. 예를 들어 다음 아키텍처를 사용하면 세 번째 레이어의 출력을 검사합니다. [X]→N1=100→N2=25→(N3=2)→N4=25→N5=100→[X][X]→N1=100→N2=25→(N3=2)→N4=25→N5=100→[X][X] \rightarrow N_1=100 \rightarrow N_2=25 …

3
컨볼 루션이 항상 홀수를 filter_size로 사용하는 이유
CNN (ConvNet)을 사용하여 출판 된 논문의 90-99 %를 살펴 보는 경우. 대부분은 홀수의 필터 크기를 사용 합니다 . {1, 3, 5, 7}은 가장 많이 사용됩니다. 이러한 상황은 몇 가지 문제로 이어질 수 있습니다.이 필터 크기의 경우 일반적으로 2의 패딩 (공통 패딩)으로 컨볼 루션 연산이 완벽하지 않으며 프로세스에서 input_field의 일부 가장자리가 …

2
가중치 및 바이어스 초기화를 0 주위에서 선택해야하는 이유는 무엇입니까?
나는 이것을 읽었다 : 신경망을 훈련시키기 위해 각 매개 변수 W (l) ijWij (l)와 각 b (l) ibi (l)을 0 근처의 작은 임의의 값으로 초기화합니다 (예 : Normal (0, ϵ2) Normal (0) , ϵ2) 작은 ϵϵ에 대한 분포, 즉 0.01) 에서 스탠포드 깊은 자습서를 학습 7 번째 단락에서 역 전파 …

1
편견을 어떻게 초기화하고 정규화해야합니까?
나는 커널 초기화에 대한 몇 가지 논문을 읽었으며 많은 논문에서 커널의 L2 정규화를 사용한다고 언급합니다 (종종 ).λ=0.0001λ=0.0001\lambda = 0.0001 상수 0으로 바이어스를 초기화하고 정규화하지 않는 것과 다른 일이 있습니까? 커널 초기화 논문 Mishkin과 Matas : 필요한 것은 좋은 init입니다 Xavier Glorot 및 Yoshua Bengio : 심층 피드 포워드 신경망 훈련의 …


1
딥 러닝의 1D 컨볼 루션 레이어 란 무엇입니까?
2D 또는 3D 구현의 경우 이미지 처리를위한 딥 러닝에서 컨볼 루션 레이어의 역할과 메커니즘에 대해 잘 이해하고 있습니다. 이미지에서 2D 패턴 (3D의 경우 3 개 채널)을 "간단하게"포착하려고합니다. 그러나 최근에 나는 자연 언어 처리의 맥락에서 1D 컨볼 루션 레이어에 부딪 혔습니다. 내 이해에는 2D 컨볼 루션이 1D (벡터) 형태로는 드러날 수없는 …

1
RNN (Recurrent Neural Network)에서 계층을 잊어 버림-
forget 레이어에서 RNN의 각 변수의 크기를 알아 내려고 노력하고 있지만 올바른 길을 가고 있는지 확실하지 않습니다. 다음 그림과 방정식은 Colah의 블로그 게시물 "LSTM 네트워크 이해"에 있습니다 . 어디: 는 크기 m의 입력 * 1 벡터엑스티xtx_tm ※ 1m∗1m*1 은 크기 n 의 숨겨진 상태입니다. * 1 벡터ht - 1ht−1h_{t-1}n ※ 1n∗1n*1 …



4
word2vec 모델을 훈련하는 동안 전이 학습을 이용할 수 있습니까?
Google 뉴스 데이터 와 같이 이미 훈련 된 모델의 사전 훈련 된 가중치를 찾고 있습니다 . 충분한 양 (10GB 등)의 데이터로 새로운 모델을 훈련하는 것이 어렵다는 것을 알게되었습니다. 따라서 사전 학습 된 레이어 가중치를 얻고 도메인 별 단어에서 해당 가중치를 재교육 할 수있는 전송 학습의 이점을 원합니다. 따라서 교육에 소요되는 …

2
데이터 스크랩을 윤리적이고 비용 효율적으로 확장
인터넷에서 구조화되고 구조화되지 않은 데이터를 긁어 내 모델에서 사용하는 것과 같은 즐거움을주는 것은 거의 없습니다. 예를 들어 Data Science Toolkit (또는 RDSTKR 프로그래머 용)을 사용하면 IP 또는 주소를 사용하여 좋은 위치 기반 데이터를 많이 가져올 수 있으며 tm.webmining.pluginR tm패키지는 재무 및 뉴스 데이터를 간단하게 폐기 할 수 있습니다. 이러한 (반) …

3
다양한 유형의 속성으로 데이터 세트를 분류하는 가장 좋은 방법
텍스트 및 숫자와 같은 혼합 유형의 속성으로 구성된 데이터 세트를 분류하는 가장 좋은 방법이 무엇인지 알고 싶습니다. 텍스트를 부울로 변환 할 수 있지만 어휘가 다양하고 데이터가 너무 희박 해집니다. 또한 속성 유형을 개별적으로 분류하고 메타 학습 기술을 통해 결과를 결합하려고 시도했지만 제대로 작동하지 않았습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.