데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

6
연속 변수가 거의없는 로그 변환을 수행 한 이유는 무엇입니까?
분류 문제를 겪고 있으며 많은 사람들의 코드와 자습서를 읽었습니다. 내가 발견 한 것은 많은 사람들이 걸릴 것입니다 np.log또는 log연속 같은 변수의 loan_amount또는 applicant_income등 나는 그 이유를 이해하고 싶습니다. 모델 예측 정확도를 향상시키는 데 도움이됩니까? 필수입니까? 또는 그 뒤에 논리가 있습니까? 가능하면 설명을 제공해주세요. 감사합니다.

3
Keras의 스트리밍 테스트 데이터에서 predict_generator로 예측을 얻는 방법은 무엇입니까?
에서 Keras 처음부터 훈련 convnets에 블로그 , 코드 쇼는 네트워크 교육 및 검증 데이터를 실행할 수 있습니다. 테스트 데이터는 어떻습니까? 유효성 검사 데이터가 테스트 데이터와 동일합니까? train 및 validation 폴더와 비슷한 줄에 별도의 테스트 폴더가있는 경우 테스트 데이터에 대한 혼동 행렬을 얻는 방법은 무엇입니까? 나는 이것을하기 위해 scikit learn 또는 …

3
xgboost에서 확률을 예측하는 방법?
아래 예측 함수는 -ve 값도 제공하므로 확률이 될 수 없습니다. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) 나는 구글 & 시도 pred_s <- predict(bst, x_mat_s2,type="response") 했지만 작동하지 않았다. 질문 대신 확률을 예측하는 방법?



1
배치 크기를 2의 거듭 제곱으로 유지하면 어떤 이점이 있습니까?
기계 학습에서 모델을 교육하는 동안 배치 크기를 2의 거듭 제곱으로 유지하는 것이 왜 유리합니까? GPU 메모리 / RAM에 가장 적합한 크기를 사용하는 것이 가장 좋을 것이라고 생각했습니다. 이 답변 은 일부 패키지의 경우 2의 거듭 제곱이 배치 크기보다 낫다고 주장합니다. 누군가 자세한 설명 / 링크를 제공 할 수 있습니까? 모든 …

5
특징 선택 대 특징 추출. 언제 사용할 것인가?
지형지 물 추출 및 지형지 물 선택은 본질적으로 데이터의 차원을 감소 시키지만, 지형지 물 추출은 또한 내가 옳다면 데이터를 더 분리 가능하게 만듭니다. 어떤 기술이 다른 기술 보다 언제 선호 됩니까? 나는 기능 선택이 원본 데이터와 속성을 수정하지 않기 때문에 훈련하고있는 기능이 변경되지 않아야 할 때 기능 선택을 사용한다고 가정합니다. …

1
RandomForestClassifier OOB 스코어링 방법
scikit-learn에서 임의 포리스트 구현은 가방 외부 샘플의 일반화 오류를 추정하기 위해 평균 정확도를 스코어링 방법으로 사용합니까? 설명서에는 언급되어 있지 않지만 score () 메서드는 평균 정확도를보고합니다. 불균형이 매우 높은 데이터 집합이 있으며 그리드 검색에서 ROC의 AUC를 점수 측정 기준으로 사용하고 있습니다. 분류 자에게 OOB 샘플에 대해 동일한 스코어링 방법을 사용하도록 지시하는 …

3
신경망 교육을 위해 범주 형 및 연속 입력 기능을 결합하는 방법
범주 형과 연속 형의 두 가지 입력 기능이 있다고 가정합니다. 범주 형 데이터는 원-핫 코드 A로 표현 될 수있는 반면, 연속 데이터는 N- 차원 공간에서 단지 벡터 B이다. A, B는 완전히 다른 종류의 데이터이기 때문에 단순히 concat (A, B)를 사용하는 것은 좋은 선택이 아닌 것 같습니다. 예를 들어, B와 달리 …

2
더미 변수 하나를 버려야하는 이유는 무엇입니까?
회귀 모델을 만들려면 범주 형 변수를 더미 변수로 변환하여 처리해야한다는 것을 배웠습니다. 예를 들어, 데이터 세트에 위치와 같은 변수가있는 경우 : Location ---------- Californian NY Florida 다음과 같이 변환해야합니다. 1 0 0 0 1 0 0 0 1 그러나 얼마나 많은 더미 변수가 있더라도 더미 변수 하나를 버려야한다고 제안했습니다. 더미 …

8
신경망을 어떻게 배우나요?
저는 현재 신경망을 사용하여 연구를하고있는 신입생 학부생입니다 (이것을 언급하면 ​​익숙하지 않을 수 있습니다). 교수님의지도에 따라 3 노드 신경망 (작동)을 코딩했습니다. 그러나 저는 AI와 데이터 과학 분야에서 경력을 쌓고 싶습니다. 그리고 이것들에 대해 더 깊이 배우고 싶습니다. 신경망 구조, 딥 러닝 등에 대해 더 자세히 알려줄 책이나 자료가 있습니까? 추천 사항이 …

2
회전 각도의 매개 변수화 회귀
화살표의 하향식 그림이 있고이 화살표가 이루는 각도를 예측하려고합니다. 이것은 도와 도 사이 또는 과 사이 입니다. 문제는이 목표가 원형이며 및 도가 정확히 동일하여 내 목표에 포함하려는 불균형이며 일반화에 크게 도움이되어야한다는 것입니다 (이것은 내 가정입니다). 문제는이 문제를 해결하는 깨끗한 방법이 보이지 않는다는 것입니다.이 문제 (또는 유사한 문제)를 해결하려고하는 논문이 있습니까? 잠재적 …

3
딥 러닝 모델에 새로운 카테고리를 추가하는 방법은 무엇입니까?
사전 훈련 된 네트워크에서 10 개의 객체를 인식하기 위해 전이 학습을 수행했다고 가정 해 보겠습니다. 내가 이미 훈련 한 10 가지 범주 나 원래 사전 훈련 된 모델의 정보를 모두 잃지 않고 네트워크가 분류 할 수있는 11 번째 항목을 어떻게 추가합니까? 친구가이 분야에서 활발한 연구가 진행되고 있다고 말했지만 관련 논문이나 …

1
신경망에서의 활성화 기능의 차이
신경망의 활성화 기능 유형을 연구했습니다. 함수 자체는 매우 간단하지만 응용 프로그램의 차이점은 명확하지 않습니다. 원하는 이진 / 연속 출력에 따라 논리 함수와 선형 함수를 구별하는 것이 합리적이지만 단순 선형 함수에 비해 시그 모이 드 함수의 장점은 무엇입니까? ReLU는 나를 위해 특히 이해하기 어렵습니다. 예를 들어 양의 입력의 경우 선형처럼 동작하지만 …

3
단어 기반 및 문자 기반 텍스트 생성 RNN의 차이점은 무엇입니까?
Recurrent Neural Networks로 텍스트 생성에 대해 읽는 동안 실제로 단어를 말하지 않고 문자별로 단어 를 생성 하고 문자별로 문자 를 생성하기 위해 일부 예가 구현되었음을 알았습니다 . 그래서, 텍스트를 예측 RNN 모델 사이의 차이가 무엇 단어 당 기준 및 텍스트 예측 사람 당 문자 근거는? 단어 기반 RNN이 더 큰 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.