2012-02-06 81 views
0

我试图按文件类型为用户设置筛选器。Google Search Appliance - 筛选文件类型的最佳方法

使用特殊查询字词File Type FilteringFile Extension Filter将文本添加到查询字词的末尾。然后依次显示“abc etx:pdf”的搜索结果,并将其添加到几乎不理想的建议中。

为每个文件类型设置单独的前端或使用as_filetype也会导致类似的困境。

我真的不想为每个人设置单独的集合,然后我会收集超过70个集合(有10个我正在爬行的网站)。

是否有任何其他替代方法可以过滤未添加到查询字词中的MIME或扩展名的结果? MIME或扩展过滤的最佳方法是什么?

+2

你找到了一个解决方案?我也在寻找相同的 – GoodSp33d 2012-04-17 09:39:44

+1

Nah,经过几个小时的搜索,我得出的结论是创建数十个集合是最好的解决方案。它不会干扰查询并具有更好的性能。 – 2012-04-17 11:47:21

回答

0

如果文件的扩展名出现在其URL中,则可以使用实体识别添加文件扩展名为特殊元数据条目。或者您可以从您的Web服务器返回一个特殊的HTTP响应头文件,您可以在GSA中将该文件配置为该文件的附加元数据。

一旦你有一个特定的文件元数据字段,你可以使用requiredfields参数来筛选它们而不会污染搜索条件。例如,假设所有PDF有一个名为“文件类型”与价值“PDF”元数据字段,搜索网址看起来可能就像

...&q=<what user searched>&requiredfields=FileType:PDF

相关问题