2016-08-03 59 views
0

我正在开发一个软件系统(Graph Database)来研究多个组件之间的互连。最终可能会产生大约30 TB的数据。我想知道在选择正确的数据库时需要考虑的因素。在为30 TB数据选择Graph DB时需要考虑哪些因素

我看的一些选项是Apache Giraph TitanDB。我也想知道是否像neo4j或OrientDB这样的小规模数据库本身可能会工作

回答

5

这是一个非常宽泛的问题,所以我会准确定义您要查找的内容,因为大小可能有点模糊。

我认为你提供的任何示例图形数据库都可以对大型数据建模。

几个“更详细”的问题,你可以问自己包括:

  1. 你关心Horizontal Scaling如果是的,那么你应该看看TitanDB,OrientDB或DSE Graph,因为Neo4J(在编写本文时)不会水平伸缩,所以它受服务器大小的限制。
  2. 标准化语言查询/遍历语言是否重要? 如果是的,那么也许你应该更多地关注Tinkerpop供应商,比如TitanDB,OrientDB,DSE Graph等等。如果没有,那么任何选项都适合你。
  3. 我的数据是否有超级节点? 如果是,那么你应该看看每个供应商如何处理超级节点。一些供应商shard,其他供应商使用巧妙的图形分区算法。
  4. 你需要多少支持? 如果你需要很多,那么也许你应该看看强大的企业解决方案,如DSE,OrientDB或Neo4J。 Neo4J目前被认为是最流行的图形数据库,并且拥有庞大的支持基础。
  5. 你想使用开源软件吗? 如果是那么TitanDB,Neo4j的,或者OrientDB可能是你

这些都只是一些的东西,你可以看看使所有的供应商之间更好的决定时进入。 备注:还有很多其他供应商可以考虑,Blazegraph,HypergraphDB,仅举几例。

+0

谢谢Felipe ... – pjesudhas

+1

Neo4j也是开源的。 GPLv3的 – Nerrve

相关问题