2016-09-28 92 views
2

从这里的文件:https://msdn.microsoft.com/en-us/library/dn760793.aspx新闻搜索API V5分页结果与偏移和计数

它说: totalEstimatedMatches: The estimated number of news articles that are relevant to the query. Use this number along with the count and offset query parameters to page the results.

不过,也有一些严重的问题。

1.返回的结果数总是少于“count”变量中的请求数。例如,设置count = 100只会得到75个结果。

2.更重要的是,即使跳过差异并发送另一个带有偏移量的查询(在本例中为offset = 100),API会返回一个新的totalEstimatedMatches! (第一个查询是70k结果,第二个是138)

这是怎么回事?我们如何完全得到第一个查询返回的totalstimaticMatches?或者,这是一个虚假膨胀的数字?

+0

您可以发送示例查询以及您在观察此问题时使用的任何其他搜索参数?我试着用查询q =“顶级新闻”使用&count = 100,并得到100条新闻结果。让我知道你也位于哪个国家,因为它会帮助我更快地调试问题。 –

+0

我位于美国。你有没有尝试抵消?这里是一个查询参数的例子:q =“cama”,cc = BR,safeSearch = Off,count = 100,offset = 100。在HTTP标头中,Accept-Language = pt。试试这些,从偏移量0开始,你会看到不仅totalEstimatedMatches不断变化,随后的偏移调用返回随机数的结果。 – user3786924

+0

感谢您的报告。我观察到同样的行为。我通知我们的新闻API小组研究这一点。来自团队的人很快就会回复。 –

回答

2

enter image description here我们在这个问题上做了一些调查。基本上,搜索引擎索引不支持对总匹配的准确估计,Bing.com上也可以观察到相同的行为。 217M导致上面的图像选项卡中提供的屏幕截图也不是很准确。

而且,新闻具有后端机制,任何查询输出都应该小于100.因此,在此示例中,估计的总匹配数量未被正确使用。通常我们不允许用户在新闻中下载每个查询的太多结果。从特定查询中获得的文档数量实际上限制在特定数量,大多数情况下大约为100.

+0

您是否在说分数没有意义,并且每个查询通常限制在100个数据项? – user3786924