我正在研究一些网页挖掘的东西,并试图找到某些特定实体的网页URL(例如,维基百科页面和主页)。由实体我的意思是一些球员的名字,位置等。例如,如果我的输入是贝克汉姆,我想以下的输出:如何为任何给定实体找到网址和图片?
网址结果:
http://en.wikipedia.org/wiki/David_Beckham
和图像结果如:
http://upload.wikimedia.org/wikipedia/commons/2/21/WikiBex.jpg
可有人请点出任何方法来实现这一目标?
不用编写搜索引擎,dbpedia spotlight就可以用来解决这个问题。 – Skandh 2012-08-03 04:09:15