데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

3
최고의 통화 시간 예측
캘리포니아의 여러 도시에있는 고객 집합, 각 고객의 통화 시간 및 통화 상태 (고객이 전화에 응답하면 True, 고객이 응답하지 않으면 False)를 포함하는 데이터 집합이 있습니다. 전화를받을 확률이 높을 수 있도록 향후 고객을위한 적절한 전화 시간을 찾아야합니다. 그렇다면이 문제에 가장 적합한 전략은 무엇입니까? 시간 (0,1,2, ... 23)이 클래스 인 분류 문제로 고려해야합니까? …

3
Jupyter 노트북의 한 셀을 내보내는 방법은 무엇입니까?
현재 Jupyter 노트북 에서 작업하고 프로토 타이핑 중 입니다. 독립형 iPython 셸 에서 일부 코드를 실행하고 싶습니다 . 지금은 iPython 코드 (파일-> 다른 이름으로 다운로드)를 내 보낸 다음 iPython 에서 실행합니다 (% run). 작동하지만 하나의 셀 또는 셀 세트 만 내보내고 싶습니다. 따라서 Jupyter 노트북 에서 수정 한 항목 만 …
10 ipython  jupyter 

2
신경망 및 의사 결정 포리스트의 데이터를 정규화하는 방법
20000 샘플의 데이터 세트가 있으며 각각 12 개의 다른 기능이 있습니다. 각 샘플의 범주는 0 또는 1입니다. 결과와 두 기술을 비교할 수 있도록 샘플을 분류하기 위해 신경망과 의사 결정 포리스트를 훈련시키고 싶습니다. 내가 우연히 만난 것은 데이터의 적절한 정규화입니다. 하나의 기능이 범위 내에 있습니다[0,106][0,106][0,10^6], 다른 하나 [30,40][30,40][30,40]다른 값을 읽을 때 …


1
방법 : 심층 신경망 가중치 초기화
을 감안할 때 어려운 학습 과제 (예 : 높은 차원, 고유 데이터의 복잡성) 깊은 신경망은 기차 열심히된다. 많은 문제를 해결하기 위해 : 품질 데이터 표준화 및 핸드 픽 다른 학습 알고리즘을 선택하십시오 (예 : Gradient Descent 대신 RMSprop) 더 가파른 그래디언트 비용 함수 선택 (예 : MSE 대신 교차 엔트로피) …

3
파이썬에서 동일한 값을 그룹화하고 빈도를 계산하는 방법은 무엇입니까?
파이썬으로 분석하는 초보자이므로 조심하십시오. 소매점에 대한 거래 데이터의 데이터 집합이 있습니다. 설명과 함께 변수는 다음과 같습니다. 섹션 : 상점의 섹션, str; prod_name : 제품 이름, str; 영수증 : 송장 번호, int; 출납원, 출납원 수, 정수; 비용 : 품목의 비용, 플로트; 날짜는 MM / DD / YY 형식으로 str입니다. HH : …

3
환경 데이터를 기반으로 작물 수확량을 예측하기위한 기계 학습 모델 구축
10 년 동안 농장의 온도, 강수량 및 콩 수확량에 대한 데이터가 포함 된 데이터 세트가 있습니다 (2005-2014). 이 데이터를 바탕으로 2015 년의 수익률을 예측하고 싶습니다. 작물 수확은 작물 재배시기가 끝날 때 발생하기 때문에 데이터 세트에는 온도 및 강수량에 대한 일일 값이 있지만 수확량에 대해 연간 1 개의 값만 있습니다. 지난 …

1
사용 가능한 사용자 제품 긍정적 (클릭 데이터) 부정 클릭 데이터를 생성하는 방법은 무엇입니까?
권장 사항에 따르면 "클릭"과 같이 레이블이있는 사용자 제품 데이터가있는 것이 일반적입니다. 모델을 배우려면 클릭 앤 클릭 데이터가 필요합니다. 생성하는 가장 간단한 방법은 클릭 데이터에서 찾을 수없는 사용자 제품 쌍을 취하는 것입니다. 그러나 오해의 소지가 있습니다. 예: user1, product1 (click) user2, product2 (click) user2, product3 (click) user3, product2 (click) product1을 제외한 …

2
데이터를 테스트 할 때 교육 데이터보다 기능이 적을 경우 어떻게해야합니까?
상점 판매를 예측하고 있으며 교육 데이터에는 두 가지 기능이 있습니다. 날짜가있는 상점 판매에 대한 정보 ( "Store"필드는 고유하지 않습니다) 상점 유형에 대한 하나 ( "Store"필드는 여기에서 고유합니다) 따라서 행렬은 다음과 같습니다. +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | Date | Sales | Customers | Open | Promo | StateHoliday | +-------+-----------+------------+---------+-----------+------+-------+--------------+ …


2
과학자들은 올바른 Hidden Markov Model 매개 변수와 토폴로지를 어떻게 사용할 수 있습니까?
유전자를 찾는 것과 같은 게놈 서열에서 숨겨진 마르코프 모델이 어떻게 사용되는지 이해합니다. 그러나 특정 Markov 모델을 만드는 방법을 이해하지 못합니다. 모델에 몇 개의 상태가 있어야합니까? 가능한 전환 수는 몇 개입니까? 모델에 루프가 있어야합니까? 모델이 최적이라는 것을 어떻게 알 수 있을까요? 그들은 서로 다른 10 가지 모델을보고 그 10 가지 모델을 …

4
강화 학습에 관한 책
나는 강화 학습을 꽤 오랫동안 이해하려고 노력했지만 어떻게 든 그리드 세계 문제를 해결하기 위해 강화 학습을위한 프로그램을 작성하는 방법을 시각화 할 수 없습니다. 강화 학습에 대한 명확한 개념을 세우는 데 도움이 될 교과서를 제안 해 주시겠습니까?

1
word2vec에는 얼마나 많은 교육 데이터가 필요합니까?
다른 출처에서 언급 한 동일한 단어의 차이점을 비교하고 싶습니다. 즉, "민주주의"와 같이 잘못 정의 된 단어의 사용에서 저자가 어떻게 다른가. 간단한 계획은 "민주주의"라는 용어를 평문으로 언급하는 책을 가져 가라 각각의 책에서 교체 democracy로democracy_%AuthorName% word2vec이 책 에서 모델 훈련 사이의 거리를 계산 democracy_AuthorA, democracy_AuthorB및 기타 레이블이 재 지정은 "민주주의"의 언급 따라서 …

1
목적 함수와 출력 레이어 활성화 기능 사이의 연결은 얼마나 유연합니까?
많은 신경망 패키지에서 목표 계층과 출력 계층의 활성화 기능이 최소화되도록 쌍을 이루는 것이 표준으로 보입니다. 예를 들어, 회귀에 사용되는 선형 출력 레이어의 경우 제곱 오차 목적 함수를 갖는 것이 표준 (및 종종 선택)입니다. 또 다른 일반적인 페어링은 로지스틱 출력 및 로그 손실 (또는 교차 엔트로피)입니다. 또 다른 하나는 softmax 및 …

1
이전 Convolutional Layer의 델타 항과 가중치를 고려하여 Convolutional Layer의 델타 항을 어떻게 계산합니까?
두 개의 회선 레이어 (c1, c2)와 두 개의 숨겨진 레이어 (c1, c2)로 인공 신경망을 훈련하려고합니다. 표준 역 전파 접근법을 사용하고 있습니다. 역방향 패스에서 이전 레이어의 오류, 이전 레이어의 가중치 및 현재 레이어의 활성화 기능에 대한 활성화의 기울기를 기반으로 레이어의 델타 항을 계산합니다. 보다 구체적으로 l 계층의 델타는 다음과 같습니다. delta(l) …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.