我从表中导入了23亿个关系,导入速度不是很快,每小时获得5M的速度,需要20天的时间才能完成迁移。我听说过neo4j批量插入和和batch insert utility。该实用程序通过从csv文件导入来做有趣的事情,但最新的代码是一些如何破碎和不运行。使用Neo4j批量插入
我在neo4j中有大约100M的关系,我必须全部检查是否应该没有重复的关系。
我怎样才能快速的东西在Neo4j的
通过当前的代码是这样
begin transaction
for 50K relationships
create or get user node for user A
create or get user node for user B
check there is relationship KNOW between A to B if not create the relationhsip
end transaction
我也阅读以下内容:
有关当前如何执行导入的更多详细信息会有帮助。批处理服务本质上是一种在单个HTTP请求中向服务器发送多个命令的方式,可减少HTTP开销。 –
我正在读取数据从数据库和导入嵌入式neo4j。 – mtariq
你有什么破的细节吗?我们很想解决它。 –