답변:
완벽하게 정직하게 말하면, 대부분의 NoSQL 데이터베이스는 빅 데이터의 응용 프로그램에 적합하지 않습니다. 모든 빅 데이터 애플리케이션의 대다수의 성능 MongoDB를이 같은 관계형 데이터베이스에 비해 MySQL은 입니다 상당히 완전히 MongoDB를 같은에서 멀리 체재 영장에 가난한 충분히입니다.
그럼에도 불구하고, 대규모 데이터 세트로 작업 할 때 확실히 유리한 NoSQL 데이터베이스의 몇 가지 유용한 속성이 있지만 읽기에 대한 SQL 에 비해 NoSQL의 성능이 일반적으로 열악합니다. 집중적 인 작업 (일반적인 빅 데이터 사용 사례와 가장 유사)이 낮습니다.
개인적 으로 데이터 과학 응용 프로그램의 백엔드를 선택하려는 경우 특정 유형의 쿼리에 대해 실제로 우수한 성능을 보여주는 Neo4j 와 같은 그래프 데이터베이스를 확인하는 것이 좋습니다 .
json
완전히 구조화 된 데이터입니다. NOSQL 데이터베이스는 실제로는 관련이 없으므로 기술적으로 모든 종류의 데이터 분석을 수행 할 수 있습니다. analytica와 같이 mongo 위에 빌드 된 도구가 있습니다 .
스키마없는 NoSQL 접근 방식의 한 가지 이점은 조기 커밋하지 않으며 Apache Drill 과 같은 적절한 도구를 사용하여 쿼리시 올바른 스키마를 적용 할 수 있다는 것 입니다. 자세한 내용은 이 프레젠테이션 을 참조하십시오. 빅 데이터 설정에서 MySQL은 제 첫 선택이 아니 었습니다.
여러 데이터베이스를 고려하고 시도하고 사용하십시오. 여기서 중요한 것은 "성능"문제가 아닙니다. 실제로 요구 사항을 충족시킬 것입니다. 당신은 얼마나 많은 데이터에 대해 이야기하고 있습니까? 어떤 종류의 데이터? 얼마나 빨리 필요합니까? 더 많이 읽거나 많이 쓰십니까?
다음은 SQL 데이터베이스에서 할 수없는 일입니다. 감정 계산. http://www.slideshare.net/shift8/mongodb-machine-learning
물론 그 경우의 속도는 당신의 필요에 충분히 빠르지 않을 수도 있지만, 그것은 가능한 것입니다. 특정 집계 값을 일부 캐싱하면 상당히 수용 가능합니다. 왜 이렇게 하시겠습니까? 편의.
편의성은 실제로 당신이 설득 할 것입니다. 이것이 바로 NoSQL 데이터베이스가 작성된 이유입니다. 물론 성능도 있지만 벤치 마크를 할인하고 다른 문제에 더 집중하려고합니다.
MongoDB (및 다른 NoSQL) 데이터베이스에는 내장 맵 / 리 듀스와 같은 매우 강력한 기능이 있습니다. 이로 인해 Hadoop과 같은 것을 사용하여 비용과 시간을 절약 할 수 있습니다. 또는 더 큰 비즈니스를 시작하기위한 프로토 타입 또는 MVP를 제공 할 수 있습니다.
그래프 데이터베이스는 어떻습니까? 그들은 "NoSQL"이기도합니다. OrientDB와 같은 데이터베이스를 살펴보십시오. 성능을 주장하고 싶다면 ... 더 빠른 SQL 데이터베이스를 보여주지 않을 것이라고 생각합니다. =) ... 그래프 데이터베이스에는 필요한 작업을 기반으로 정말 놀라운 응용 프로그램이 있습니다.
기술의 규칙 (그리고 인터넷)은 한 가지에 너무 편하지 않습니다. 당신은 제한되고 실패에 대비할 것입니다.