«data-mining» 태그된 질문

크고 복잡한 데이터 세트에서 패턴을 찾는 활동입니다. 일반적으로 알고리즘 기법을 강조하지만 해당 목표를 가진 관련 기술, 응용 프로그램 또는 방법론을 포함 할 수도 있습니다.

4
데이터 분석을 디버그하는 방법?
나는 정찰이 다소 일반적이라는 다음과 같은 문제를 겪었습니다. 예를 들어 몇 백만 개의 큰 데이터가 있습니다. 몇 가지 하위 쿼리로 구성된 SQL 쿼리와 같은 사소한 분석을 실행합니다. 예를 들어 시간이 지남에 따라 속성 X가 증가하고 있다는 결과가 나옵니다. 이제 두 가지 가능한 결과가 있습니다. X는 시간이 지남에 따라 실제로 증가하고 …

1
ElasticSearch에 저장된 고객 데이터 클러스터링
고객 프로필에 저장되어 있습니다. 탄성 검색클러스터. 이 프로파일은 이제 이메일 구독을위한 대상 그룹을 만드는 데 사용됩니다. 대상 그룹은 이제 탄력적 검색면 검색 기능을 사용하여 수동으로 구성됩니다 (예 : 자동차 한 대와 어린이 세 대를 가진 23 세의 모든 남성 고객 확보). 데이터 과학, 기계 학습, 클러스터링 등을 사용하여 흥미로운 그룹을 …

5
좋은 단어 중지 목록을 만드는 방법
중지 단어 목록을 큐 레이트하는 방법에 대한 힌트를 찾고 있습니다. 누군가가 사전 처리 및 필터링을 위해 데이터 세트 자체에서 중지 단어 목록을 추출하는 좋은 방법을 알고 있거나 추천 할 수 있습니까? 자료: 수년에 걸쳐 가변 길이 (검색어 및 전체 문장 (최대 200 자))의 방대한 양의 인간 텍스트 입력. 이 텍스트에는 …

2
아마존에서 사용자의 구매 행동을 모델링하는 방법은 무엇입니까?
데이터 과학의 최종 과정 프로젝트를 위해 다음을 제안했습니다. Amazon Reviews Dataset을 제공하면 Amazon 에 광고를 배치하기위한 전략적 위치를 결정하는 알고리즘 (대략 개인화 된 PageRank 기반)을 제시 할 계획입니다. 예를 들어 아마존에는 수백만 개의 제품이 있습니다. 그리고 데이터 세트는 어떤 제품이 관련되어 있는지, 어떤 제품이 모여서 함께 보았는지 등에 대한 아이디어를 …

1
ILP가없는 관계형 데이터 마이닝
분류 모델을 만들어야하는 관계형 데이터베이스의 거대한 데이터 세트가 있습니다. 일반적으로이 상황에서는 IOP ( Inductive Logic Programming )를 사용하지만 특수한 상황으로 인해이를 수행 할 수 없습니다. 이것을 해결하는 다른 방법은 내가 외국 관계가있을 때 가치를 모으는 것입니다. 그러나, 나는 몇 가지 명목상의 속성에 대해 수천 가지 중요하고 뚜렷한 행을 가지고 있습니다 …

1
학습 신호 인코딩
맨체스터 인코딩 비트 스트림을 오디오 신호로 나타내는 많은 샘플이 있습니다. 인코딩되는 주파수는 높은 주파수의 주요 주파수 구성 요소이며 백그라운드에 일정한 양의 화이트 노이즈가 있습니다. 이 스트림을 수동으로 디코딩했지만 인코딩 체계를 배우기 위해 일종의 기계 학습 기술을 사용할 수 있는지 궁금합니다. 이렇게하면 이러한 체계를 수동으로 인식하는 데 많은 시간이 절약됩니다. 어려움은 …

2
스마트 폰 데이터 세트 문제를 이용한 인간 활동 인식
저는이 커뮤니티를 처음 사용하므로 제 질문이 여기에 잘 맞기를 바랍니다. 학부 데이터 분석 과정의 일환으로 스마트 폰 데이터 세트를 사용하여 인간 활동 인식 프로젝트를 선택했습니다. 내가 우려하는 한이 주제는 기계 학습 및 지원 벡터 기계와 관련이 있습니다. 아직이 기술에 익숙하지 않으므로 도움이 필요합니다. 이 프로젝트 아이디어를 따르기로 결정했습니다 http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (위의 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.