2012-07-30 78 views
-1

我正在研究一些网页挖掘的东西,并试图找到某些特定实体的网页URL(例如,维基百科页面和主页)。由实体我的意思是一些球员的名字,位置等。例如,如果我的输入是贝克汉姆,我想以下的输出:如何为任何给定实体找到网址和图片?

网址结果:

http://www.davidbeckham.com/

http://en.wikipedia.org/wiki/David_Beckham

和图像结果如:

http://upload.wikimedia.org/wikipedia/commons/2/21/WikiBex.jpg

可有人请点出任何方法来实现这一目标?

回答

0

我认为这可能对他人有帮助。几种语义Web实现在查找关于实体的信息时非常有用。我发现dbpedia(这是维基百科的语义网表示)非常有用,虽然有一些陡峭的学习曲线,如SPARQL,RDF,但它是值得的和令人兴奋的。

0

是的,这是相当容易:

你只需要实现一个搜索引擎如谷歌。然后你可以搜索这个名字,它会给你你想要的结果!

+0

不用编写搜索引擎,dbpedia spotlight就可以用来解决这个问题。 – Skandh 2012-08-03 04:09:15