2017-07-25 52 views
1

我在我的项目中探索Apache OpenNLP产品,其中一个要求是在我的案例中坚持训练有素的DB - Mongo DB/couchbase模型。 现在主要是我期待的文档分类模型输出存储数据库,这样我就不必重新运行,除非它修改Apache OpenNLP坚持型号到DB

我看到库中的类不能序列例如DocumentCategorizerME和我得到json deserilization异常,如果我试图检索持久性记录,所以想知道是否有人已经这样做。

一般来说,即使我想使用任何其他开源NLP产品,也会坚持这种方法。

回答

0

一个可以使用DoccatModel.serialize序列化和模型存储蒙戈DB应遵循的方法 - GridFS的

Couchbase DB具有20 MB大小的硬限制,存储二进制数据。