在测试发现服务后,至少对我来说似乎毫无用处,或者我可能会错过某些东西。如何使用Watson Discovery获取准确答案而不是整个文档?
当我查询时,它匹配文档并返回整个文档。如果我的文档很大,那么对于所有查询,它将返回与查询文本相匹配的整个文档,这是无用的。
现在我需要为每个查询创建一个单独的文档吗?
如果是这样,API.AI或WIT.AI是一个更好的选择。
请清除我在这里失踪的东西!
在测试发现服务后,至少对我来说似乎毫无用处,或者我可能会错过某些东西。如何使用Watson Discovery获取准确答案而不是整个文档?
当我查询时,它匹配文档并返回整个文档。如果我的文档很大,那么对于所有查询,它将返回与查询文本相匹配的整个文档,这是无用的。
现在我需要为每个查询创建一个单独的文档吗?
如果是这样,API.AI或WIT.AI是一个更好的选择。
请清除我在这里失踪的东西!
对于Discovery现在,您需要分割一次文档以将其放入集合中,然后在Discovery中针对集合的任何查询都会返回该分离文档集合中的结果。所以如果你的文件没有改变,这个分割应该是一次性的动作。
虽然自动识别查询的较大文档的相关部分的解决方案对于Discovery(注:我为IBM Watson工作)是一个很好的考虑因素。
机智或api更类似于我们的watson会话服务。 发现是关于从语料库中查找相关内容,而您提到的两个以及我们的对话服务,更多地是使用NLP来理解查询来响应对话。
你已经部分回答了我的问题,另一部分是,我是否需要为每个查询创建数百个单独的文档,因为目前从大型单个文档查询多个查询是没有用的,那么使用Watson的另一种方式是什么? – johnrao07
Watson Discovery服务允许在数百个文档中进行认知搜索。 您可以使用Watson文档转换服务为每个JSON格式的文档自动创建PAU(可能的答案单元)的粒度。然后,您可以加载Watson发现服务中的Watson文档转换生成的PAU。 这样,Watson Discovery将为您的认知查询返回确切的答案。
现在有一个passages
参数可以传递给查询API。截至撰写本文时,它处于测试阶段。它提供了文档中的位置以及“段落”文本和分数。
{
"document_id": "dd2a7574-c266-4587-812b-69a47aa271d6",
"passage_score": 23.961884787023948,
"passage_text": " query block name in many hints to specify the query block to which the hint applies. This syntax lets you specify in the outer query a hint that applies to an inline view.\n\nThe syntax of the query block",
"start_offset": 404,
"end_offset": 607
},
你是正确的,今天发现服务返回匹配查询整个文件,按相关性排名的查询。你能再描述一下你的用例吗?像你正在建造什么样的应用程序? – catbelly
我目前正在测试这项服务,如果您所说的话是正确的,那么涉及很多手动工作,这不是做这些工作的最佳方式,我想我们仍然需要等待一段时间才能得到这些东西开发。 – johnrao07