2017-08-14 54 views
0

是否有任何基于云的替代Azure搜索的替代方法可以索引azure blob的内容? (主要是办公室文件)?Azure搜索用于索引blob的替代方法

我有一个应用程序,公开了很少使用的全文搜索。 Azure搜索非常适用于documentdb等,基本层涵盖了这种用法。

但是,如果对一天可能搜索多次的blob应用索引,那么与堆栈中使用的其他功能相比,其成本非常高。

我们还达到了2GB的存储限制,但文件限制不到20%。理想情况下,我们希望增加存储空间,但如果不通过更新S1来提高存储成本3倍,则这不是一种选择。

到目前为止发现的替代方法是运行solr虚拟机或构建我们自己的能力,这可能仍然需要虚拟机的所以solr在这种情况下会更好。

似乎其他人在成本方面遇到了这个缩放问题,但通常是因为QPS。我们的QPS在24小时内进行了几次搜索,结果非常低。

::看着保持在Azure中。 AWS CloudSearch帐单似乎与我们的使用案例一起工作得很好

回答

1

我在Azure搜索工程团队。很抱歉听说定价不适合你。正如您所提到的,在Azure中运行您自己的SOLR或ElasticSearch实现当然是一种选择,但我怀疑您期望使用Azure Search的原因之一是由于您不打算将搜索管理添加到您的解决方案。

如果你不明确你想要做什么(例如,你只是在做这个内容的全文搜索还是你在做更多的诸如分面,过滤等等),很难进入特定的选项。让我抛出一个选项。

您能缩小内容尺寸吗?例如,您是否真的需要在Azure搜索中拥有所有这些内容,或者您​​可以说只是从这些内容中索引关键术语和短语,以便您可以识别包含您正在查找的术语的文档?有很多伟大的技术(例如Word2Vec)非常适合于能够提取术语和短语。

另一个优点是,这些术语也可以用于分面和过滤,然后您可以根据需要简单地加载其他商店的全部内容。

提取术语的缺点可能不包括您认为重要的一些术语。

还有很多其他的选择,但如果我更了解您正在寻找的东西,也许我可以帮助更多。

Liam