2012-07-20 112 views
0

我想为我最后一年的硕士学位设计一个语义搜索引擎。我一直在网上和学术论文上随便阅读大量的文章,所以我在这个领域并不是一个完全的技术。语义搜索引擎

我的目标是构建一个语义搜索引擎,将HTML内容解析为等价的RDF三元组,将三元组存储在三重存储中,引擎将尝试响应使用SPARQL触发的查询。与其他学生不同,我想做一些开箱即用的事情。所以,我决定构建一个语义搜索引擎。

现在,我有一个运行搜索引擎使用Solr执行关键字搜索,我想要做的是语义搜索。我知道一些关于Web 3.0的开源工具,但不确定它们是否与Solr兼容。

所以,你能否给我提供一些建设相同的帮助。

谢谢。 Regards

+1

嗯,首先,您应该澄清或定义“语义搜索”的含义。那么你可以认为RDF可能会帮助你(或者不可能)。 尝试在Google上搜索“leonardo da vinci death”。这是“语义搜索”的例子吗?如果你问我,我肯定会说是。那是你想要达到的目标吗? – castagna 2012-07-22 07:20:52

+0

某种程度上,YES.Thats我想要的。 感谢您的回复。 – srijla 2012-07-22 09:12:54

+0

我该如何实现? – srijla 2012-07-22 09:13:19

回答

0

虽然听起来很难,但是你将无法捕捉到一切。

  1. 您需要大量的数据。当然,已经有很多数据按照你可能使用的owl和rdf等格式排列(例如WordNet,Yago,GeoNames等),但它们虽然规模很大,但只关注可能话语的很小部分宇宙。

  2. 开发一个好的语义搜索需要大量的资源和大脑的力量。项目,例如德国人工智能研究中心的KompParse,只关注一小部分人类交谈(闲话或购买家具),现在已经和几位员工一起工作了好几年,现在仍然“不错”。

  3. 理解语义已经在不同的搜索引擎中实现,例如google或wolfram alpha。所以这个话题甚至可能不像你想象的那样“开箱即用”。

所以我会和user723630一起去,强烈建议你关注一个小题目。你仍然会获得很多,但你不会感到沮丧。