데이터 과학 machine-learning

3

Data Scaling, 특히 표준화 방법을 연구하고 있습니다. 나는 그 배후의 수학을 이해했지만 기능에 평균과 단위 분산을 제로로 부여하는 것이 왜 중요한지 명확하지 않습니다. 나 한테 설명해 줄래 ?

10 machine-learning feature-scaling normalization

4

주요 구성 요소 분석은 차원 축소 기술입니다. 즉, 10 개의 입력 기능이 주어지면 원래 기능의 직교 및 선형 변환 인 더 적은 수의 독립적 인 기능이 생성됩니다. 가요 PCA자체 학습 알고리즘으로 간주하거나 데이터 전처리 단계에 의해.

10 machine-learning pca

3

GPS 좌표 (위도 및 경도)를 선형 모델의 피쳐로 사용할 수 있습니까?

많은 기능 중에서 GPS 좌표 (위도 및 경도)를 포함하는 데이터 세트가 있습니다. 이 데이터 세트를 사용하여 다음과 같은 문제를 탐색하고 싶습니다. (1) ETA를 계산하여 시작 지점과 끝 지점 사이를 이동합니다. 및 (2) 특정 지점에 대한 범죄의 양을 추정. 선형 회귀 모델을 사용하고 싶습니다. 그러나 이러한 GPS 좌표를 선형 모델에서 직접 …

10 machine-learning feature-selection linear-regression feature-extraction geospatial

2

마지막 레이어에서 Keras Multiple“Softmax”가 가능합니까?

Keras의 마지막 레이어에서 다중 소프트 맥스를 구현할 수 있습니까? 따라서 노드 1-4의 합은 1입니다. 5-8 = 1; 기타 다른 네트워크 디자인을해야합니까?

10 machine-learning keras multiclass-classification

2

많은 기능으로 로지스틱 회귀를 수행하는 방법은 무엇입니까?

로지스틱 회귀에 대한 이진 클래스 문제가있는 각 샘플에 대해 330 개의 샘플과 27 개의 기능이있는 데이터 세트가 있습니다. "10이면 규칙"에 따르면 각 기능을 포함하려면 최소한 10 개의 이벤트가 필요합니다. 그럼에도 불구하고 나는 긍정적 인 클래스 20 %와 부정적인 클래스 80 %의 불균형 데이터 세트를 가지고 있습니다. 이로 인해 70 개의 …

10 machine-learning python predictive-modeling logistic-regression data

2

word2vec의 기능 매트릭스는 무엇입니까?

저는 신경망의 초보자이며 현재 word2vec 모델을 탐색하고 있습니다. 그러나 기능 매트릭스가 정확히 무엇인지 이해하기가 어렵습니다. 첫 번째 행렬은 주어진 단어에 대한 one-hot 인코딩 벡터라는 것을 이해할 수 있지만 두 번째 행렬은 무엇을 의미합니까? 보다 구체적으로, 이들 각각의 값 (즉, 17, 24, 1 등)은 무엇을 의미합니까?

10 machine-learning neural-network word2vec

1

영어 문장의 복잡성을 결정하는 방법?

사람들이 제 2 언어로 영어를 배우도록 돕기 위해 앱을 개발 중입니다. 추가 문맥을 제공함으로써 문장이 언어를 배우는 데 도움이된다는 것을 확인했습니다. 나는 60 명의 학생들로 구성된 작은 교실에서 작은 연구를 수행함으로써 그렇게했습니다. 다양한 영어 단어 (Barrons'800 단어 및 1000 개의 가장 일반적인 영어 단어 포함)에 대해 Wikipedia에서 수십만 문장을 채굴했습니다. …

10 machine-learning classification nlp text-mining

3

최고의 통화 시간 예측

캘리포니아의 여러 도시에있는 고객 집합, 각 고객의 통화 시간 및 통화 상태 (고객이 전화에 응답하면 True, 고객이 응답하지 않으면 False)를 포함하는 데이터 집합이 있습니다. 전화를받을 확률이 높을 수 있도록 향후 고객을위한 적절한 전화 시간을 찾아야합니다. 그렇다면이 문제에 가장 적합한 전략은 무엇입니까? 시간 (0,1,2, ... 23)이 클래스 인 분류 문제로 고려해야합니까? …

10 machine-learning classification regression scikit-learn

1

방법 : 심층 신경망 가중치 초기화

을 감안할 때 어려운 학습 과제 (예 : 높은 차원, 고유 데이터의 복잡성) 깊은 신경망은 기차 열심히된다. 많은 문제를 해결하기 위해 : 품질 데이터 표준화 및 핸드 픽 다른 학습 알고리즘을 선택하십시오 (예 : Gradient Descent 대신 RMSprop) 더 가파른 그래디언트 비용 함수 선택 (예 : MSE 대신 교차 엔트로피) …

10 machine-learning neural-network deep-learning randomized-algorithms

1

사용 가능한 사용자 제품 긍정적 (클릭 데이터) 부정 클릭 데이터를 생성하는 방법은 무엇입니까?

권장 사항에 따르면 "클릭"과 같이 레이블이있는 사용자 제품 데이터가있는 것이 일반적입니다. 모델을 배우려면 클릭 앤 클릭 데이터가 필요합니다. 생성하는 가장 간단한 방법은 클릭 데이터에서 찾을 수없는 사용자 제품 쌍을 취하는 것입니다. 그러나 오해의 소지가 있습니다. 예: user1, product1 (click) user2, product2 (click) user2, product3 (click) user3, product2 (click) product1을 제외한 …

10 machine-learning data-mining

2

데이터를 테스트 할 때 교육 데이터보다 기능이 적을 경우 어떻게해야합니까?

10 machine-learning regression feature-selection feature-construction missing-data

2

과학자들은 올바른 Hidden Markov Model 매개 변수와 토폴로지를 어떻게 사용할 수 있습니까?

유전자를 찾는 것과 같은 게놈 서열에서 숨겨진 마르코프 모델이 어떻게 사용되는지 이해합니다. 그러나 특정 Markov 모델을 만드는 방법을 이해하지 못합니다. 모델에 몇 개의 상태가 있어야합니까? 가능한 전환 수는 몇 개입니까? 모델에 루프가 있어야합니까? 모델이 최적이라는 것을 어떻게 알 수 있을까요? 그들은 서로 다른 10 가지 모델을보고 그 10 가지 모델을 …

10 machine-learning model-selection hyperparameter markov

4

강화 학습에 관한 책

나는 강화 학습을 꽤 오랫동안 이해하려고 노력했지만 어떻게 든 그리드 세계 문제를 해결하기 위해 강화 학습을위한 프로그램을 작성하는 방법을 시각화 할 수 없습니다. 강화 학습에 대한 명확한 개념을 세우는 데 도움이 될 교과서를 제안 해 주시겠습니까?

10 machine-learning books reinforcement-learning

1

이전 Convolutional Layer의 델타 항과 가중치를 고려하여 Convolutional Layer의 델타 항을 어떻게 계산합니까?

두 개의 회선 레이어 (c1, c2)와 두 개의 숨겨진 레이어 (c1, c2)로 인공 신경망을 훈련하려고합니다. 표준 역 전파 접근법을 사용하고 있습니다. 역방향 패스에서 이전 레이어의 오류, 이전 레이어의 가중치 및 현재 레이어의 활성화 기능에 대한 활성화의 기울기를 기반으로 레이어의 델타 항을 계산합니다. 보다 구체적으로 l 계층의 델타는 다음과 같습니다. delta(l) …

10 machine-learning data-mining neural-network deep-learning

2

지역에 민감한 해시 증폭

가능한 모든 쌍을 비교하지 않고도 비슷한 항목 쌍을 찾을 수 있도록 코사인 로컬 리티에 민감한 해시를 작성하려고합니다. 나는 기본적으로 작동하지만 내 데이터의 대부분의 쌍은 -0.2에서 +0.2 범위의 코사인 유사성을 가진 것처럼 보이므로 상당히 미세하게 주사위를 굴려 코사인 유사성이 0.1 이상인 것을 선택하려고합니다. Mining Massive Datasets 3 장을 읽었습니다. 이것은 Locality-Sensitive …

10 machine-learning

«machine-learning» 태그된 질문