2017-11-25 164 views
0

有没有将数据从Marklogic服务器复制/移动到Amazon S3的方法?我不希望所有的数据都被移动,但某些文档属于特定的集合或其他逻辑。我可以做xdmp:save(),它可以用于几千个文档,但是我有几百万条记录,这种方法在这种情况下效果不好,是否有更好更健壮的方法可以用来复制数据过度?我可以为此使用MLCP还是使用派生模块通过任务服务器运行它并完成此项工作?我正在AWS上运行的ML-8上运行。将数据从Marklogic复制到Amazon S3

任何建议都将非常有帮助。

问候 阿米特

+0

查看同类内容[访问S3](https://stackoverflow.com/questions/37554370/xquery-api-to-upload-data-from-marklogic-to-amazon -S3) – DALDEI

回答

0

我用铝塑复合出口作出的变化,它工作得很好具有收藏过滤器,并为我做的伎俩。我还没有尝试过CORB2,但在时间允许的情况下也会尝试使用

mlcp export -host {host} -port {port} -username {username} -password {password} -output_file_path {S3 path } -collection_filter {集合名称被移动}

1

我会用Corb2方便xdmp:保存()命令,因为S3://是一个内置的文件系统。使用MLCP的任何解决方案都会遭受更多数据传输,除非您还需要归档(如果要保留属性,权限,集合等,这是一个有效的点),否则我不确定该值。

其次 - 我从来没有做过,但我明白你可以使用S3作为森林的位置。在这种情况下,您可以将某些文档与位于S3上的森林进行平衡。

0

使用REST API和管道输出检索MarkLogic文件到AWS命令上传到AWS S3斗:

curl --anyauth --user user:password -X GET -H "Content-type: application/xml" http://localhost:8052/LATEST/documents?uri=/docs/test.xml | aws s3 cp - s3://yourbucket/test.xml