我正在写csv文件来训练排名在沃森检索和排名服务,与许多行[查询,“id_doc”,“relevance_score”,...] 。
我对这个文件的结构两个问题:
IBM沃森检索和排名服务 - 布尔运算符
- 我必须区分两个文件,这取决于查询是否包含单词“不”。更具体的:
- 所述主体和所述第一文档的标题包含“经理”
- 所述主体和所述第二文件的标题包含“不经理”
因此,如果查询就像“我是经理,我怎么......?”那么第一个文件是正确的,但不是第二个文件。 如果查询,如“我不是一个经理......”,那么第二份文件是正确的,但不是第一个。
是否有可以用来写在一个适当的方式查询任何特定的语法?也许使用布尔运算符?这个文件是否适用于这种过滤器?
2.该服务也有一个Web界面来训练排序器。本网站使用的评分为:1->错误答案,2->与主题相关但不回答问题,3->良好,但可以改进,4->完美答案。
在此文件中的Web界面的同一个使用的相关性得分?
谢谢!