데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

10
deconvolutional 레이어는 무엇입니까?
필자는 최근 Jonathan Long, Evan Shelhamer, Trevor Darrell의 Semantic Segmentation 을 위한 Full Convolutional Networks를 읽었습니다 . 나는 "deconvolutional layer"가 무엇을하고 어떻게 작동하는지 이해하지 못한다. 관련 부분은 3.3. 업 샘플링은 역행 된 회선입니다 거친 출력을 고밀도 픽셀에 연결하는 또 다른 방법은 보간입니다. 예를 들어, 간단한 이중 선형 보간은 입력 및 ...

30
공개적으로 사용 가능한 데이터 세트
데이터 과학의 일반적인 문제 중 하나는 여러 소스에서 데이터를 어떻게 정리 (반 구조화 된) 형식으로 수집하고 다양한 소스의 메트릭을 결합하여 더 높은 수준의 분석을 수행하는 것입니다. 다른 사람들의 노력, 특히이 사이트의 다른 질문들을 보면이 분야의 많은 사람들이 다소 반복적 인 일을하고있는 것 같습니다. 예를 들어 트윗, 페이스 북 게시물, 위키 ...

13
혼합 숫자 및 범주 형 데이터에 대한 K- 평균 군집
내 데이터 세트에는 많은 숫자 속성과 하나의 범주가 있습니다. , 말 NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, 여기서,이 CategoricalAttr세 개의 가능한 값 중 하나를 취 CategoricalAttrValue1, CategoricalAttrValue2또는 CategoricalAttrValue3. Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/에 대한 기본 k- 평균 군집 알고리즘 구현을 사용하고 있습니다 . 숫자 데이터로만 작동합니다. 그래서 내 질문 : 범주 속성 CategoricalAttr을 세 ...



5
신경망에서“dying ReLU”문제는 무엇입니까?
Convolutional Neural Networks for Visual Recognition 에 대한 Stanford 과정 노트를 참조하면 다음 과 같은 단락이 있습니다. "안타깝게도 ReLU 장치는 훈련 중에 깨지기 쉬우 며"사라질 수 있습니다 ". 예를 들어, ReLU 뉴런을 통해 흐르는 큰 기울기는 뉴런이 데이터 포인트에서 다시 활성화되지 않는 방식으로 가중치가 업데이트되도록 할 수 있습니다. 예를 들어, ...

5
신경망의 교차 엔트로피 오류 함수
에서 ML 초보자를위한 MNIST 그들은 같은 교차 엔트로피를 정의 Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) i y ′ iyiyiy_i 는 클래스 대한 예측 확률 값 이고 는 해당 클래스에 대한 실제 확률입니다.iiiy′iyi′y_i' 질문 1 ( )가 0이 될 수 있는 문제가 ? 이것은 물론 우리가 정말 나쁜 분류기를 ...

8
scikit_learn 모델에서 fit과 fit_transform의 차이점은 무엇입니까?
저는 데이터 과학 에 익숙 하지 않으며 scikit-learn의 방법 fit과 차이점을 이해하지 못합니다 fit_transform. 왜 우리가 왜 데이터를 변환해야하는지 설명 할 수 있습니까? 훈련 데이터에 모델을 맞추고 테스트 데이터로 변환하는 것은 무엇을 의미합니까? 예를 들어 범주 형 변수를 학습에서 숫자로 변환하고 데이터를 테스트하기 위해 새 기능 세트를 변환하는 것을 의미합니까?

6
멀티 클래스 분류 설정에서 마이크로 평균 대 매크로 평균 성능
3 클래스로 멀티 클래스 분류 설정을 시도하고 있습니다. 클래스 분포는 대부분의 데이터가 3 개 클래스 중 1 개에 해당하므로 왜곡됩니다. (클래스 레이블은 1,2,3이며, 데이터의 67.28 %가 클래스 레이블 1에, 클래스 2에 11.99 %, 클래스 3에 남아 있음) 이 데이터 세트에서 다중 클래스 분류기를 훈련하고 있으며 다음과 같은 성능을 얻습니다. Precision ...

15
기계 학습을위한 Python vs R
학문적 목적으로 기계 학습 응용 프로그램 을 개발하기 시작했습니다 . 나는 현재 R을 사용 하고 있으며 스스로 훈련하고 있습니다. 그러나 많은 곳에서 사람들이 Python을 사용하는 것을 보았습니다 . 사람들은 학계와 산업에서 무엇을 사용하며 권장 사항은 무엇입니까?

3
One Hot Encoding vs LabelEncoder vs DictVectorizor를 언제 사용해야합니까?
나는 한동안 범주 형 데이터로 모델을 구축 해 왔으며이 상황에서 기본적으로 모델을 만들기 전에이 데이터를 변환하기 위해 scikit-learn의 LabelEncoder 함수를 기본적으로 사용합니다. 나는 사이의 차이 이해 OHE, LabelEncoder그리고 DictVectorizor그들이 데이터에 무엇을하고 있는지의 관점에서,하지만 다른 통해 하나 개의 기술을 사용하도록 선택할 수 있습니다 때 나에게 명확하지 않습니다 것입니다. 어떤 알고리즘이 다른 ...

6
LSTM을 통한 GRU 사용시기
GRU와 LSTM의 주요 차이점은 GRU에는 2 개의 게이트 ( 리셋 및 업데이트 게이트)가 있고 LSTM에는 3 개의 게이트 (즉, 입력 , 출력 및 잊어 버림 게이트)가 있다는 것입니다. LSTM 모델 (세 개의 게이트가 있음)을 통해 네트워크를보다 잘 제어 할 때 왜 GRU를 사용합니까? 어떤 시나리오에서 GRU가 LSTM보다 선호됩니까?

12
빅 데이터는 얼마나 큰가요?
많은 사람들이 빅 데이터 라는 용어를 다소 상업적인 방식으로 사용하는데, 이는 큰 데이터 세트가 계산에 관련되어 있음을 나타 내기위한 수단이므로 잠재적 솔루션의 성능이 우수해야합니다. 물론 빅 데이터는 항상 확장 성 및 효율성과 같은 관련 용어를 사용하지만 문제를 빅 데이터 문제 로 정확히 정의하는 것은 무엇 입니까? 계산은 데이터 마이닝 / ...

8
학습률 선택
저는 현재 SGD역 전파를 사용하는 신경망에 대해 확률 적 그라디언트 디센트 (Stochastic Gradient Descent)를 구현 하고 있으며 그 목적을 이해하는 동안 학습률에 대한 값을 선택하는 방법에 대한 몇 가지 질문이 있습니다. 학습률은 하강 률을 지시하므로 오차 기울기의 모양과 관련이 있습니까? 그렇다면이 정보를 어떻게 사용하여 가치에 대한 결정을 내립니까? 어떤 종류의 ...


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.