3

我的表弟创建了语义搜索引擎,他声称他的搜索引擎是最准确的。如何确定语义搜索引擎的准确性?

我见过很多语义搜索引擎,他们看起来都一样对我来说,因为它们不是设计给您根据您键入的关键字结果。

所以,如果你正在创建一个语义搜索引擎,如何确定其结果的准确性?

+1

给100人看看他们对结果的满意度吗? – sarnold

+0

@sarnold是有一个比较科学的方法来确定,如果你有一个很好的履带... – Lynob

+0

我问的是技术方面,而不是如果人们喜欢还是不喜欢 – Lynob

回答

2

其实sarnold的建议并不遥远。

什么,你通常会做的是采取一大堆的人,并让他们尝试了一堆标准查询。或者,如果你想让实验更公平,你可以让每个用户选择自己的查询,以避免任何偏见(因为你可以选择标准查询,你知道你的引擎擅长回答)。

对于每个查询的用户会期待通过前10个左右的结果,并说他们是否认为每一个结果是相关或不(你可能需要有用户评分的规模,而不是仅仅是/否)。

然后对于每个查询,您可以计算准确性分数,具体取决于您如何设置实验Precision and Recall可能是最合适的措施,尽管这些措施依赖于您可能不一定有的已知预期答案。计算简单的百分比准确度可能更简单也更合适。

要确定您的搜索引擎是否比你的竞争对手你有相同的人对这些搜索引擎以相同的方式得分执行相同的查询更好。完成这些后,您可以计算并比较搜索引擎的分数与您自己的分数。

+0

,吸,我期待一些数学,概率,等等。 ..我不敢相信你可以依靠人们的意见,统计数据很糟糕......如果我在2搜索引擎搜索引擎上输入'obama in iraq',就会显示'奥巴马做出撤军决定',另一个会显示'奥巴马管理部门在伊拉克犯了什么错误......'那些人的区别是什么...... – Lynob

+0

那么精确度和召回率是合适的数学,但他们首先依靠你有一个预期的答案来计算它们。如果你没有这个,那么你只能做一个用户意见调查 – RobV