我有一个存储在mongodb数据库中的希腊语推文的大型数据库。MongoDB文本索引不受支持的语言
(3M Tweets大约30GB的存储空间)。
我在文本上创建了一个文本索引,并在时间戳字段上创建了一个有序索引。但是,我发现MongoDB不支持希腊语文本索引,因此希腊语文本查询相对较慢。我如何面对这个问题,并为希腊文件创建一个倒排索引?
我有一个存储在mongodb数据库中的希腊语推文的大型数据库。MongoDB文本索引不受支持的语言
(3M Tweets大约30GB的存储空间)。
我在文本上创建了一个文本索引,并在时间戳字段上创建了一个有序索引。但是,我发现MongoDB不支持希腊语文本索引,因此希腊语文本查询相对较慢。我如何面对这个问题,并为希腊文件创建一个倒排索引?
使用solr构建您的索引而不是mongodb,它具有很多支持多语言搜索的功能。
我刚刚发现,如果我根据文档选择语言,则不会创建使用标记化的简单倒排索引。
http://docs.mongodb.org/manual/reference/text-search-languages/#text-search-languages
如果指定“无”的语言值,然后将文本搜索使用 没有停止词列表简单的符号化,并没有制止
好[文章](HTTP ://ngsiolei.blogspot.in/2010/11/basic-inverted-index-in-mongodb.html) –