我们希望为在线/离线产品构建搜索引擎。我们开始浏览网页,并了解倒排索引,TF/IDF和其他通用搜索相关算法等技术。我们使用了内置所有上述技术的lucene,并且我们的基本搜索平台已准备就绪。建筑搜索引擎产品搜索
后来我们意识到通用搜索引擎会返回任何类型的输出。 说如果我搜索“黑色鞋子”,搜索字符串输出将包含既有黑色又有鞋子的输出。所以在输出中,很可能会有一件黑色衬衫,但关联度较低。
所以我们认为产品分类可能是我们的救援。我们将根据它携带的属性对我们的产品进行分类,然后我们也将解析查询字符串来挖掘用户正在查找的内容并直接匹配它们。我不确定是否应该遵循这种方式。
所以我想知道通常在建立利基市场的搜索引擎之后有哪些不同的技术?
非常感谢您的建议。我会毫不犹豫地阅读有关SpanNearQuery并尝试在我们的应用程序中实现它。 – 2014-10-19 09:54:52