2017-01-16 65 views
1

我正在使用滑动窗口算法在DBpedia中搜索URI。输入关键字字符串后,我将它们分成小群集,然后在DBpedia上搜索。滑动窗口算法:使用SPARQL在DBpedia中搜索精确实体

实施例:

关键字:Actor of the film titanic

=>将它们分开成: Actor of theActor ofActorof the filmof theof,​​the moviethefilm titanicmovietitanic

问题:我如何搜索确切的使用SPARQL包含名为关键字(以上分析过的短语)的实体?

非常感谢。

+0

我注意到,你正在做的事情超过*分裂*原始的搜索词 - 因为你有'电影'和'泰坦尼克号'(大写'T')在你的分离的集合中,但是这些不会出现在原版的。这使得你的问题比第一次出现更大 - 并重新发明了更多的车轮。 – TallTed

回答

1
  1. 有这么多的问题回答出系统现在链接数据和对DBpedia的评价 - 我不明白你为什么要推倒重来。

  2. SPARQL查询通过使用什么?您可以匹配rdfs:label的值,例如

    SELECT DISTINCT ?s WHERE {?s rdfs:label "KEYWORD"@en .}

但最QA系统使用基于Lucene或类似物预先计算的全文索引。至少,这就是我们在QA项目中做到的。

+0

非常感谢。我使用以下查询: SELECT distinct?s WHERE { ?s rdfs:label“+ searchText +”@ en。“ ?s foaf:name”+ searchText +“@ en。” ?s foaf:givenName “+ searchText +”@ en。“ ... } –