我必须找到> 200个单词的定义。我想使用维基百科为了从列表中搜索带有给定单词的intlated文章,然后提取其定义的原始文本(文章的第一句)。事实上,在我的项目中,我有一个包含单词(simlpe和composated)的Jlist。我想为每个词找到一个使用维基百科的定义(我选择这个百科全书是因为这些词是从一个专门的语料库中提取的)。我的问题是:如何从维基百科转储中检索定义?我发现JWPL,但没有找到帮助我使用它的例子。另一个问题是:如果维基百科离线(使用WikiTaxi),如何使用Java从它提取定义?维基百科文章的第一句和Java
谢谢。
您有问题吗? –
正在做作业吗?你究竟在问什么? – luketorjussen
你不会在这里得到代码。你需要模拟网络爬虫。一种方法是找到一个页面,你可以找到你想要的单词列表。为工作提取超链接,并使用http://java-source.net/open-source/crawlers/java-web-crawler其中一个lib抓取页面来提取信息。 – harshit