«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.

3
사용자가 모든 항목의 일부만 볼 수있는 상황에 대한 권장 엔진은 무엇입니까?
문서 관리 시스템에 추천 기능을 추가하고 싶습니다 . 대부분의 회사 문서가 저장되는 서버입니다. 직원은 웹 인터페이스를 탐색하고 클릭하여 원하는 문서를 다운로드하거나 온라인으로 읽습니다. 각 직원은 모든 문서의 하위 집합에만 액세스 할 수 있습니다. 내 목표 : 팀원이 최근에 열어 본 문서 나 방금 연 문서의 부속물로 사용되는 스프레드 시트 또는 …

2
아마존에서 사용자의 구매 행동을 모델링하는 방법은 무엇입니까?
데이터 과학의 최종 과정 프로젝트를 위해 다음을 제안했습니다. Amazon Reviews Dataset을 제공하면 Amazon 에 광고를 배치하기위한 전략적 위치를 결정하는 알고리즘 (대략 개인화 된 PageRank 기반)을 제시 할 계획입니다. 예를 들어 아마존에는 수백만 개의 제품이 있습니다. 그리고 데이터 세트는 어떤 제품이 관련되어 있는지, 어떤 제품이 모여서 함께 보았는지 등에 대한 아이디어를 …

3
감정 분석 자습서
감정 분석과 모든 언어 (R, Python 등)를 사용하여 적용하는 방법을 이해하려고합니다. 인터넷에 내가 따라 할 수있는 튜토리얼을위한 좋은 장소가 있는지 알고 싶습니다. 나는 봤지만 튜토리얼이 아니고 이론이 많기 때문에 크게 만족하지 못했습니다. 이론과 실제적인 예를 원합니다.


2
VC 치수와 자유도의 관계
저는 머신 러닝을 공부하고 있는데 VC 차원의 개념과 더 고전적인 (통계적) 자유도 개념 사이에는 강한 관계가 있다고 생각합니다. 누구든지 그런 연결을 설명 할 수 있습니까?

1
NER에 Vowpal Wabbit 사용
Vowpal Wabbit (VW)는 SEARN을 통한 시퀀스 태깅 기능을 지원합니다 . 문제는 설명과 예제가있는 자세한 매개 변수 목록을 찾을 수 없다는 것입니다. 내가 찾을 수있는 가장 좋은 예는 Zinkov의 블로그 항목 입니다. 주요 위키 페이지는 거의 SEARN을 언급하고있다. 체크 아웃 된 소스 코드에서 일부 NER 샘플 데이터가있는 데모 폴더를 찾았습니다. 불행히도, …

2
파이썬에서 보완적인 Naive Bayes를 구현하고 있습니까?
문제 범죄 데이터의 레이블이 지정된 데이터 세트에서 Naive 베이를 사용하려고 시도했지만 실제로는 좋지 않은 결과를 얻었습니다 (7 % 정확도). Naive Bayes는 내가 사용했던 다른 알고리즘보다 훨씬 빠르게 실행되므로 점수가 왜 그렇게 낮은 지 알아 내고 싶었습니다. 연구 읽은 후 Naive bayes는 균형 잡힌 데이터 세트와 함께 사용해야한다는 것을 알았습니다. 주파수가 …

2
차원 축소와 반대되는 방법이 있습니까?
저는 기계 학습 분야에 익숙하지 않지만 신호 처리에 대한 부분을 다했습니다. 이 질문에 잘못 표기된 경우 알려주십시오. 시뮬레이션하기에는 너무 복잡한 비선형 모델 방식으로 적어도 3 개의 변수로 정의 된 2 차원 데이터가 있습니다. PCA 및 ICA와 같은 방법 (python 라이브러리 Scikit-Learn에서)을 사용하여 데이터에서 두 가지 주요 구성 요소를 추출하는 데 …

4
텍스트 분류기 교육 데이터 세트 제안
텍스트 분류기를 훈련시키기 위해 어떤 무료 데이터 집합을 사용할 수 있습니까? Google은 사용자에게 가장 관련성 높은 콘텐츠를 추천하여 사용자 참여를 향상 시키려고 노력하고 있으므로 미리 정의 된 단어 모음을 기반으로 콘텐츠를 분류하는 경우 이미 분류 된 임의의 게시물 수에 대한 피드백을 통해 콘텐츠를 참여시키는 것이 좋습니다. 전에. 이 정보를 사용하여 …

1
학습 신호 인코딩
맨체스터 인코딩 비트 스트림을 오디오 신호로 나타내는 많은 샘플이 있습니다. 인코딩되는 주파수는 높은 주파수의 주요 주파수 구성 요소이며 백그라운드에 일정한 양의 화이트 노이즈가 있습니다. 이 스트림을 수동으로 디코딩했지만 인코딩 체계를 배우기 위해 일종의 기계 학습 기술을 사용할 수 있는지 궁금합니다. 이렇게하면 이러한 체계를 수동으로 인식하는 데 많은 시간이 절약됩니다. 어려움은 …

2
스마트 폰 데이터 세트 문제를 이용한 인간 활동 인식
저는이 커뮤니티를 처음 사용하므로 제 질문이 여기에 잘 맞기를 바랍니다. 학부 데이터 분석 과정의 일환으로 스마트 폰 데이터 세트를 사용하여 인간 활동 인식 프로젝트를 선택했습니다. 내가 우려하는 한이 주제는 기계 학습 및 지원 벡터 기계와 관련이 있습니다. 아직이 기술에 익숙하지 않으므로 도움이 필요합니다. 이 프로젝트 아이디어를 따르기로 결정했습니다 http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (위의 …

1
불균형 클래스를 다루기위한 접근법의 분류
불균형 계급 문제를 해결하기 위해 개발 된 접근법을 분류하는 가장 좋은 방법은 무엇입니까? 이 기사는 다음과 같이 분류합니다. 전처리 : 오버 샘플링, 언더 샘플링 및 하이브리드 방법, 비용에 민감한 학습 : 직접 분석법과 메타 학습을 포함하며 후자는 임계 값과 샘플링으로 더 나뉘어집니다. 앙상블 기술 : 앙상블 학습과 함께 비용에 민감한 …



2
내 훈련 세트에 음의 y 값이 없을 때 그라디언트 증폭 회귀 분석에서 음수 값을 예측하는 이유는 무엇입니까?
내가 나무의 수를 증가로 scikit 학습 의를 GradientBoostingRegressor, 나는 부정적인 값 내 훈련이나 설정을 테스트에 없다하더라도, 더 부정적인 예측을 얻을. 나는 약 10 가지 기능을 가지고 있으며, 대부분 바이너리입니다. 내가 튜닝 한 일부 매개 변수는 다음과 같습니다. 나무 / 반복 횟수; 학습 깊이; 학습 속도. 음수 값의 백분율은 ~ 2 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.