«bigdata» 태그된 질문

빅 데이터는 규모가 크고 복잡한 데이터 집합을 지칭하는 용어로, 실제 데이터베이스 관리 도구 또는 기존의 데이터 처리 응용 프로그램을 사용하여 처리하기가 어렵습니다. 문제는 캡처, 큐 레이션, 스토리지, 검색, 공유, 전송, 분석 및 시각화입니다.

3
정기적으로 증가하는 기능 세트 처리
사기 탐지 시스템을 개발 중입니다. 이 필드에서는 새로운 사기가 정기적으로 나타나므로 지속적으로 모델에 새로운 기능을 추가해야합니다. 개발 프로세스 관점에서 처리하는 가장 좋은 방법이 무엇인지 궁금합니다. 새로운 기능을 기능 벡터에 추가하고 분류자를 재교육하는 것은 기존 기능을 다시 학습하는 데 너무 많은 시간이 걸리기 때문에 순진한 접근 방식으로 보입니다. 각 기능 (또는 …

4
라이브러리를 사용하는 동안 효율성을 부여하기 어려운 이유는 무엇입니까?
작은 데이터베이스 처리는 언어 자체의 라이브러리 및 / 또는 유틸리티를 사용하는 Python / Perl / ... 스크립트로 쉽게 처리 할 수 ​​있습니다. 그러나 성능과 관련하여 사람들은 C / C ++ / 저수준 언어를 찾는 경향이 있습니다. 코드를 필요에 맞게 조정할 수있는 가능성은 메모리 관리, 병렬 처리, 디스크 액세스 또는 심지어 …

1
다른 파이썬 커널간에 DataFrame을 다시로드하지 마십시오.
변수 (큰 테이블 / 데이터 프레임)를 메모리에 유지하고 여러 ipython 노트북에서 공유하는 방법이 있습니까? MATLAB의 지속적 변수와 개념적으로 유사한 것을 찾고 있습니다. 여러 개별 편집기 (노트북)에서 사용자 정의 함수 / 라이브러리를 호출하고 해당 외부 함수가 일부 결과 (또는 큰 테이블)를 캐시 할 수 있습니다. 주로 새로운 분석을 시작할 때마다 약 …

2
스마트 폰 데이터 세트 문제를 이용한 인간 활동 인식
저는이 커뮤니티를 처음 사용하므로 제 질문이 여기에 잘 맞기를 바랍니다. 학부 데이터 분석 과정의 일환으로 스마트 폰 데이터 세트를 사용하여 인간 활동 인식 프로젝트를 선택했습니다. 내가 우려하는 한이 주제는 기계 학습 및 지원 벡터 기계와 관련이 있습니다. 아직이 기술에 익숙하지 않으므로 도움이 필요합니다. 이 프로젝트 아이디어를 따르기로 결정했습니다 http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (위의 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.