«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.


1
심층 컨볼 루션 신경망에 유용한 데이터 확대 기술은 무엇입니까?
배경 : 저는 최근 Geoffrey Hinton의 훌륭한 연설을보고 컨볼 루션 신경망을 훈련 할 때 데이터 보강의 중요성에 대해 더 깊이 이해했습니다 . 그는 현재의 컨볼 루션 신경망은 테스트 대상 물체의 참조 프레임을 일반화 할 수 없으므로, 네트워크가 물체의 거울상이 동일하다는 것을 네트워크가 진정으로 이해하기 어렵게 만든다고 설명했다. 이 문제를 해결하기 …

3
기계 학습 모델 (GBM, NN 등)을 생존 분석에 어떻게 사용할 수 있습니까?
나는 Cox 비례 위험 회귀 및 일부 Kaplan-Meier 모델과 같은 전통적인 통계 모델을 사용하여 다음 사건이 발생할 때까지의 일을 실패 등으로 예측할 수 있습니다. 즉 생존 분석 질문 GBM, 신경망 등과 같은 기계 학습 모델의 회귀 버전을 사용하여 이벤트가 발생할 때까지 일을 어떻게 예측할 수 있습니까? 대상 변수로 발생까지 일을 …

1
감독 차원 축소
15K 레이블이 지정된 샘플 (10 그룹)로 구성된 데이터 세트가 있습니다. 레이블의 지식을 고려하여 차원 축소를 2 차원으로 적용하고 싶습니다. PCA와 같은 "표준"감독되지 않은 차원 축소 기법을 사용할 때 산점도는 알려진 레이블과 관련이없는 것 같습니다. 찾고있는 이름이 있습니까? 솔루션에 대한 몇 가지 참조를 읽고 싶습니다.

3
컨볼 루션 신경망은 행렬 곱셈 대신 컨볼 루션을 정확히 어떻게 사용합니까?
딥 러닝 에 관한 Yoshua Bengio의 책을 읽고 있었고 224 페이지에 나와 있습니다. 컨볼 루션 네트워크는 레이어 중 하나 이상에서 일반 행렬 곱셈 대신 컨볼 루션을 사용하는 신경망입니다. 그러나 수학적으로 정확한 의미에서 "콘볼 루션으로 행렬 곱셈을 대체하는"방법을 100 % 확신하지 못했습니다. 내가 정말로 관심있는 것은 1D의 입력 벡터 ( 와 …

3
랜덤 포레스트 및 부스팅 파라 메트릭 또는 비 파라 메트릭입니까?
탁월한 통계 모델링 을 읽음으로써 두 문화 (Breiman 2001) 는 전통적인 통계 모델 (예 : 선형 회귀)과 기계 학습 알고리즘 (예 : 배깅, 랜덤 포레스트, 부스트 트리 ...)의 모든 차이점을 파악할 수 있습니다. Breiman은 데이터 모델 (모수)이 통계를 통해 알려진 자연스럽고 모방 된 공식 모델에 의해 관측이 생성된다는 가정에 근거하기 …



4
교차 검증은 데이터 스누핑과 어떻게 다릅니 까?
방금 "통계 학습 소개"를 마쳤습니다 . 교차 검증을 사용하여 다양한 머신 러닝 기술에 대한 최상의 튜닝 매개 변수를 찾는 것이 데이터 스누핑과 다른지 궁금합니다. 튜닝 세트의 어떤 값이 테스트 세트에서 최상의 예측 결과를 가져 오는지를 반복해서 점검하고 있습니다. 우리가 도달 한 튜닝 매개 변수가 우연히이 특정 테스트 세트에 맞고 향후 …

3
다단계 / 계층 구조 데이터의 임의 포리스트
나는 기계 학습, CART 기술 등을 처음 접했고, 순진한 것이 너무 명확하지 않기를 바랍니다. Random Forest는 다단계 / 계층 적 데이터 구조를 어떻게 처리합니까 (예 : 교차 수준 상호 작용이 필요한 경우)? 즉, 여러 계층 적 수준에서 분석 단위가 포함 된 데이터 세트 ( 예 : 학교 내에 중첩 된 …

3
비선형 데이터에 대해 가능하면 커널 트릭을 사용해야합니까?
최근에 Kernel 트릭을 사용하는 방법에 대해 배웠습니다.이 방법은 데이터를 해당 차원의 데이터를 선형화하기 위해 더 높은 차원의 공간에 매핑합니다. 이 기술을 사용하지 않아야하는 경우가 있습니까? 올바른 커널 기능을 찾는 것이 문제입니까? 선형 데이터의 경우 물론 도움이되지 않지만 비선형 데이터의 경우 항상 유용합니다. 학습 시간 및 확장 성 측면에서 선형 분류기를 …

2
멀티 클래스 퍼셉트론은 어떻게 작동합니까?
나는 수학에 대한 배경 지식이 없지만 간단한 Perceptron의 작동 방식을 이해하고 하이퍼 평면의 개념을 이해한다고 생각합니다 (나는 3D 공간에서 두 점 구름을 분리하는 선으로 구분되는 것처럼 기하학적으로 상상합니다) 2D 공간에서 두 점 구름). 그러나 나는 하나의 평면이나 하나의 선이 3D 공간 또는 2D 공간에서 각각 3 개의 다른 점 구름을 …

2
랜덤 포레스트 모델을 사용할 때 변수를 기록 / 처리하는시기?
여러 속성을 기반으로 가격을 예측하기 위해 Random Forests를 사용하여 회귀를 수행하고 있습니다. 코드는 Scikit-learn을 사용하여 Python으로 작성됩니다. 회귀 모형에 맞도록 변수를 사용 하기 전에 exp/ log를 사용하여 변수를 변환해야하는지 어떻게 결정 합니까? Random Forest와 같은 Ensemble 방식을 사용할 때 필요합니까?

2
자기 연구는 얼마나 멀리 갈 수 있습니까?
나는 공식 또는 구조화 된 데이터 분석 또는 머신 러닝 과정 (최근의 온라인 오퍼링 제외)에 참여한 적이 없으며 읽거나 시도하여 내가 아는 대부분의 것을 배웠습니다. 나는 직장을 구할 수 없다는 것을 알고 있습니다. 제 질문은 더 나은 것이 아니라 ( 이 질문과 같은 ) 오히려 직업을 신청할 수있는 수준에 도달 …

1
머신 러닝의 기능 구성 및 표준화
영화 M에 대한 물류 분류기를 만들고 싶다고 가정 해 보겠습니다. 내 특징은 사람의 나이, 성별, 직업, 위치와 같은 것입니다. 훈련 세트는 다음과 같습니다. 연령 성별 직업 위치 좋아요 (1) / 싫음 (0) 23 M 소프트웨어 미국 1 24F 닥터 영국 0 등등 .... 이제 내 질문은 어떻게 기능을 확장하고 표현해야 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.