2011-07-05 53 views
1

有没有人在使用wikitools获取wikipedia页面上使用python(和django)的经验?我正在尝试获得这篇文章,但是我得到了一些第一行,就是这样。我需要获取整篇文章,但似乎无法弄清楚。文档也不是很有帮助。我的代码是:wikitools,维基百科和python

wikiobj = wiki.Wiki("http://en.wikipedia.org/w/api.php?title=Some_Title&action=raw&maxlag=-1") 
wikipage = page.Page(wikiobj, url, section='content') 
wikidata = wikipage.getWikiText(True).decode('utf-8', 'replace') 

任何帮助将不胜感激。

回答

1

我使用的IM wikitools我的项目,而不是在页面上获取文本,但我以不同的方式初始化维基对象:

wikiobj = wiki.Wiki("http://en.wikipedia.org/w/api.php") 
wikipage = page.Page(wikiobj, title="Some_Title") 

你不需要api.php后的任何查询提供给在Wiki类中。

接下来,看看Page类的定义:

__init__(self, site, title=False, check=True, followRedir=True, section=False, sectionnumber=False, pageid=False, namespace=False) 

所以,你需要提供标题页面类的构造函数(你提供一些未知url PARAM)。