4

在测试发现服务后,至少对我来说似乎毫无用处,或者我可能会错过某些东西。如何使用Watson Discovery获取准确答案而不是整个文档?

当我查询时,它匹配文档并返回整个文档。如果我的文档很大,那么对于所有查询,它将返回与查询文本相匹配的整个文档,这是无用的。

现在我需要为每个查询创建一个单独的文档吗?

如果是这样,API.AIWIT.AI是一个更好的选择。

请清除我在这里失踪的东西!

+0

你是正确的,今天发现服务返回匹配查询整个文件,按相关性排名的查询。你能再描述一下你的用例吗?像你正在建造什么样的应用程序? – catbelly

+0

我目前正在测试这项服务,如果您所说的话是正确的,那么涉及很多手动工作,这不是做这些工作的最佳方式,我想我们仍然需要等待一段时间才能得到这些东西开发。 – johnrao07

回答

7

对于Discovery现在,您需要分割一次文档以将其放入集合中,然后在Discovery中针对集合的任何查询都会返回该分离文档集合中的结果。所以如果你的文件没有改变,这个分割应该是一次性的动作。
虽然自动识别查询的较大文档的相关部分的解决方案对于Discovery(注:我为IBM Watson工作)是一个很好的考虑因素。

1

机智或api更类似于我们的watson会话服务。 发现是关于从语料库中查找相关内容,而您提到的两个以及我们的对话服务,更多地是使用NLP来理解查询来响应对话。

+0

你已经部分回答了我的问题,另一部分是,我是否需要为每个查询创建数百个单独的文档,因为目前从大型单个文档查询多个查询是没有用的,那么使用Watson的另一种方式是什么? – johnrao07

0

Watson Discovery服务允许在数百个文档中进行认知搜索。 您可以使用Watson文档转换服务为每个JSON格式的文档自动创建PAU(可能的答案单元)的粒度。然后,您可以加载Watson发现服务中的Watson文档转换生成的PAU。 这样,Watson Discovery将为您的认知查询返回确切的答案。

0

现在有一个passages参数可以传递给查询API。截至撰写本文时,它处于测试阶段。它提供了文档中的位置以及“段落”文本和分数。

{ 
 
    "document_id": "dd2a7574-c266-4587-812b-69a47aa271d6", 
 
    "passage_score": 23.961884787023948, 
 
    "passage_text": " query block name in many hints to specify the query block to which the hint applies. This syntax lets you specify in the outer query a hint that applies to an inline view.\n\nThe syntax of the query block", 
 
    "start_offset": 404, 
 
    "end_offset": 607 
 
},

相关问题