Neo4j vs OrientDB vs 타이탄


13

사회적 관계 마이닝과 관련된 데이터 과학 프로젝트를 진행 중이며 일부 그래프 데이터베이스에 데이터를 저장해야합니다. 처음에는 Neo4j를 데이터베이스로 선택했습니다. 그러나 Neo4j는 잘 확장되지 않습니다. 내가 찾은 대안은 Titan과 oriebtDB입니다. 내가 겪었 이 세 가지 데이터베이스에 비교,하지만 이러한 데이터베이스에 대한 자세한 내용을 좀하고 싶습니다. 그래서 가장 좋은 것을 선택하는 데 도움이 될 수 있습니까? 주로 성능, 스케일링, 사용 가능한 온라인 설명서 / 자습서, Python 라이브러리 지원, 쿼리 언어 복잡성 및 이러한 데이터베이스의 그래프 알고리즘 지원을 비교하고 싶습니다. 또한 다른 좋은 데이터베이스 옵션이 있습니까?


1
: 또한 Graphlab은 (파이썬 기반) 고려 graphlab.com/products/create/overview.html은 여기뿐만 아니라 그것에 대해 좋은 블로그 게시물입니다 : bugra.github.io/work/notes/2014-04-06/... 그럴 수 없어 Titan vs oriebtDB 토론에 도움이됩니다. 바라건대 누군가가 그와 함께 할 것입니다.
nfmcclure

Spark 및 GraphX
sheldonkreger

이 기사에서는 확장 성, Titan의 특별한 이점에 대한 세부 정보를 보여줍니다. groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
Henry H.

2
아니요, 그렇지 않습니다. GraphX는 데이터베이스가 아닙니다.
Emre

몇 달 전부터는 진전이 있다고 생각합니다. 자신 만의 답변을 추가해 보시겠습니까 (여기 또는 다른 곳)?
Jayan

답변:


1

전반적인 데이터 파이프 라인과 머신 러닝 파이프 라인을 염두에 두어야 할 수도 있습니다. 이를 위해서는 강력한 분산 처리와 별개로 테이블과 스토리지 사이의 그래프간에 데이터를 이동하기위한 강력한 프레임 워크가 필요합니다. 내가 이해 한 바에 따르면 Spark GraphX는 이러한 파이프 라인을 구축 할 것을 약속합니다. YouTube에서 GraphX에 대한 Joseph Gonzalez (CMU의 GraphLab 제작자 중 한 사람)의 이야기는 가치가 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.