2013-04-23 139 views
1

查看this relatively old blogpost关于Cloudant's search featureCloudant搜索功能

一直在寻找解答一些疑问,因为我们使用的Cloudant Heroku的附加组件&需要支持搜索查询:

  • 是否有可能在基于Lucene的搜索索引存储中CouchDB的本身,所以如果我们复制数据库(例如,在移动设备上的Couchbase/CouchDB),那么索引数据也会随之而来?

  • 将对复制的CouchDB数据库或仅在Cloudant上进行索引工作?

  • 如果我们将PDF作为CouchDB文档中的附件存储,该怎么办?有没有支持索引和搜索这样的领域开箱即用?我们是否应该分析PDF的&编写我们自己的分析仪,然后导入到Cloudant中?

  • 如果我们想要支持,最好的方法是什么?如何搜索从Cloudant复制到移动设备上的本地CouchDB实例的CouchDB的PDF'附件'的内容?

如果有人能够通过Cloudant提供一些实现这些指标的指针,那将会很棒。

我知道还有一些替代品,如CouchDB-Lucene,如here所述。

但是由于我们使用Cloudant作为中央CouchDB,很想知道这是否可以轻松完成。

感谢

+0

请记住,Couchbase和CouchDB是2个不同的项目,你可以在这里看到http://www.couchbase.com/couchbase-vs-couchdb – 2013-04-23 21:29:10

+0

是的,我知道。现在让我们假设这是两个地方的CouchDB。 (但事实是,我们在Cloudant上安装了CouchDB,在Android设备上安装了Couchbase-mobile)。 想知道如果我们必须在设备上使用类似[CouchDB-Lucene](http://rnewson.github.com/couchdb-lucene/)的东西?因为这是我们需要搜索的地方? – fritz 2013-04-24 07:49:46

回答

3

是否可以存储基于Lucene的搜索索引中的CouchDB的本身,所以,如果我们复制DB(比方说,一个Couchbase/CouchDB的移动设备上),那么索引数据也随之而来呢?

Cloudant上的搜索索引始终存储在数据库之外。与查看数据一样,它们不会被复制。否则,我们不能使用Lucene高度优化的磁盘格式。对复制CouchDB的数据库或者只在Cloudant

威尔索引工作?

搜索索引只能在Cloudant上使用(使用设计文档中的“索引”字段)。您需要为移动设备或复制的vanilla-CouchDB实例提供单独的解决方案。

如果我们将PDF作为CouchDB文档中的附件存储,该怎么办?有没有支持索引和搜索这样的领域开箱即用?我们是否应该分析PDF的&编写我们自己的分析仪,然后导入到Cloudant中?

目前,您需要使用Tika之类的东西来解析PDF中的文本,并将其存储在文档中的字段中,然后通过搜索对其进行索引。自定义分析器不太可能得到支持,尽管支持索引二进制文件可能会在某个时刻到达。

如果我们希望支持,最好的方法是什么?如何搜索从Cloudant复制到移动设备上的本地CouchDB实例的CouchDB的PDF'附件'的内容?

这取决于平台。由于您已经解析了用于Cloudant搜索的PDF文本,因此您可以使用设备上的本地搜索API。不幸的是,到目前为止,这些还有点薄弱,我还没有时间为自己尝试。这是一个耻辱SearchKit尚未在iOS上提供,据我所知。

或者您可以使用Cloudant的搜索在线搜索,然后从本地数据库中提取文档,就像您拥有文档ID一样。