我有两个簇作为具有如何在文档聚类后在特定集群中实现查询搜索?
Cluster : class
DocumentList : List<Document>
centroidVector : Map<String,Double>
现在的问题是,当搜索查询它被解析为一个文件,然后制作成一个文档对象,加入到documentIndex和其索引被构造一个类连同其他文件。我这样做是因为它必须经历相同的过程,即标记,词干等。但是现在我想在查询向量最相似的特定聚类中实现查询搜索,即点积〜0.5 -1。所以我将不得不在查询向量和集群向量之间做点积。但我不知道如何实现它,因为索引是在内存中创建的,并不存储在数据库中。仍在这样做的过程中。
谢谢
那么你的问题到底是什么呢?请重新考虑你的问题,你期待什么作为答案?到目前为止,你没有得到太多的答案,对吧?那是因为你的问题含糊不清,“我该怎么办”,而不是“我该如何解决这个问题”。这不是*工作*这样的互联网网站! – 2012-07-19 18:50:56
我应该将聚类向量保存在某个地方,以便在加载查询时,我可以取点产品并只加载那些文档以便在集群中存在索引?它可以完成而不储蓄?因为问题的关键是集群在查询文档被解析时与其一起构建。 – YuNo 2012-07-19 18:59:14
取决于您未提供的100个因素。 – 2012-07-19 19:10:55